2016年亚太杯APMCM数学建模大赛C题影视评价与定制求解全过程文档及程序

本文主要是介绍2016年亚太杯APMCM数学建模大赛C题影视评价与定制求解全过程文档及程序,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

2016年亚太杯APMCM数学建模大赛

C题 影视评价与定制

原题再现

  中华人民共和国成立以来,特别是政治改革和经济开放后,随着国家经济的增长、科技的发展和人民生活水平的提高,中国广播电视媒体取得了显著的成就,并得到了迅速的发展。截至目前,中国广播电视传媒已经为未来产业发展奠定了良好的基础。

  2012年,中国共制作了893部电影,总票房170.73亿元,比上年增长30.18%。其中,中国国产电影票房达到82.73亿元,占全年总票房的48.46%。这是自2003年以来,中国国产电影首次被进口电影击败。2012年2月,中美双方就WTO电影相关问题达成《WTO谅解备忘录》,并决定增加进口电影配额。在最初的20部进口电影配额之外,还将有14部高科技格式的美国电影。票房分账的比例也从之前的17.5%上升到了25%。国内电影市场现在处境不佳。

  美国的文化产业,也就是所谓的版权产业,占GDP的10%,而中国只有不到3%。如今,在中国,一集电视节目的价格可以达到7位数,未来可能达到8位数。这也符合中国的经济发展。富裕经济后对文化和娱乐的需求增加,将推动该行业快速增长,成为未来增长最快的企业之一。

  在“十二五”期间,中国将大力发展影视制作、文化创作、娱乐表演等七大重点文化产业。在此期间,中国影视产业将迎来一个重要的战略机遇期;政府将加大扶持力度,为中国影视业创造良好的营商环境。中国电影奖委员会将在未来5年保持每年500部电影的产量。2014年,中国电影市场票房将突破300亿元,预计观影人数将达到11.12亿,相当接近全国总人口。此外,影院将变得更加多样化;小众电影和艺术电影也将有自己的放映空间。国务院《电影产业繁荣发展促进指导意见》指出,到2015年底,通过改革创新、加大投资、加快发展,我国将建立健全公平的市场竞争、企业自主经营的电影产业经营体系、市场运作、企业管理、,政府采购,以及电影公共服务体系的公共利益。

  当前的中国电视市场竞争激烈,充满了不同的风格和话题。虽然每年的电视剧产量仍然很高,但电视台并没有太多的购买欲望,这导致了电视剧供过于求。据统计,每年有一半以上的电视作品在没有买家的情况下被浪费,造成了巨大的资源浪费。数量从来都不是电视剧的问题,但质量一直是我们需要解决的问题。如何降低成本,摆脱草率粗暴的电视投资,决定着电视剧的未来发展。未来电视剧之间的竞争将是一场质量竞赛。只有保证电视剧的质量,才能获得最大的回报。

  同时,利用2014年的大数据作为测试电视市场的分析工具也取得了相当成功。虽然大数据无法创建脚本,但它可以非常精确地分析数据和预测。这可以应用于剧本编写、电视收视率预测、电视广告结果和电视剧购买。可以降低电视投资风险,提高剧本质量,预测观众反应,以确保最大效益。

  在影视剧市场中,如何对影视剧进行评价和定制等问题一直是一个制作过程中关注的焦点。现在请尝试使用数学建模方法来解决以下问题。

  问题1:根据排名指数对电视剧进行排名,并用附件1和附件2中的数据说出你的前十名。

  问题2:演员的受欢迎程度排名对电视剧的制作可能非常有用。请收集并使用相关数据作为基础,设计一个明星人气指数,并尝试通过givi来证明你的指数的可达性。

import requests
import re
import httplib
import md5
import urllib
import random
import json
def translate(q):appid = '20151113000005349'secretKey = 'osubCEzlGjzvw8qdQc41'httpClient = Nonemyurl = '/api/trans/vip/translate'fromLang = 'zh'toLang = 'en'salt = random.randint(32768, 65536)sign = appid+q+str(salt)+secretKeym1 = md5.new()m1.update(sign)sign = m1.hexdigest()myurl =
myurl+'?appid='+appid+'&q='+urllib.quote(q)+'&from='+fromLang+'&to='+
toLang+'&salt='+str(salt)+'&sign='+sign
try:httpClient = httplib.HTTPConnection('api.fanyi.baidu.com')httpClient.request('GET', myurl)#response HTTPResponseresponse = httpClient.getresponse()return json.loads(response.read())['trans_result'][0]['dst']except Exception, e:print efinally:if httpClient:httpClient.close()
tags =
['love','comedy','city','Suspense''Costume','idol','crime','history',
'war','Martial arts','Police bandit','Science Fiction']
def get_page(tag):url = "http://v.sogou.com/teleplay/list/style-%s+zone-内
地.html"%(tag)con = requests.get(url).textreturn con
def find_vedio(context):# print contextpattern = r'target=\"_blank\">(.*?)<\/a><\/div>'return re.findall(pattern, context)
def get_data(tags):out = []for tag in tags:data = {}vedios = find_vedio(get_page(tag))data[tag] = vediosout.append(data)return out
if __name__ == '__main__':data = get_data(tags)for tag in data:key = tag.keys()[0]# print key
vedios = tag.values()[0]for vedio in vedios:# print data so that can be covertd to csv format.print translate(key)+','+translate(vedio.encode('utf-8'))

整体求解过程概述(摘要)

  明星和戏剧问题基于大数据。为了解决这些问题,从互联网上搜索可靠的数据,过滤掉坏值,确定权重并给出预测具有重要意义。
  首先,关于电视剧排名,我们选择电视剧评分、每部电视剧的评论家数量和电视剧集数量作为前三个重要指标来判断最终排名。为了找出三个指标中最合理的权重,我们使用TOPSIS法来计算最佳权重。最后,当直接计算指标之间的关系不明确时,基于灰色关联度和单层次综合评价给出了剧集的排名。
  其次,我们认为评判明星人气的指标是丰富的、非官方的,因此Apriori算法可以用来过滤不重要的指标,只保留高权重的指标。通过遍历从互联网上收集的多个数据,我们得到了最终的频繁n项集,其中n项集是最重要的索引。然后利用主成分分析法得到相关指标的权重。除此之外,还应考虑特殊情况,例如由花边新闻在短时间内引起的剧烈变化。最后,我们将基于我们的指数的排名与官方网站上的排名进行比较,发现大致相等。
  第三,为了建立一个新的团队来创建新产品,我们可以使用爬虫从互联网上搜索到的数据,如点击率、评论家、主演、制作团队等。为了过滤掉不重要的指标,可以使用逐步回归方法,然后我们可以得到标准化。通过这个等式,每个指数都将对应一个权重,该权重衡量对最终指数的贡献。然后,将导出的排名与官方排名进行比较,以获得可信度,并判断该指数是可接受的。根据最终指标,描述一个理想的生产团队。
  最后,从观众的浏览历史和每个频道的评分中获得最合适的推荐。这里使用LDA算法,找出主要趋势和主要类型的历史。赋值主要取决于历史数据具有不同类型的概率,然后通过余弦计算找到拟合度最高的数据。使用标准化后的数据,我们证明了该模型的可信度高达93.2%。此外,当依赖于评级时,该模型也是可靠的。
  每个模型都经过了来自现实的数据测试,这些数据来自互联网,由Python中的爬虫搜索。

模型假设:

  1) 数据可以正确反映受欢迎程度。没有恶意提高知名度的网络雇佣兵。
  2) 所有以明星或戏剧名字命名的论坛都在谈论这个主题。论坛上有所有相关的帖子
  3) 知名网站的排名没有商业猜测。所有的排名都依赖于现实,而且必须是客观的。
  4) 这些模型具有通用性。因为来自互联网的数据不可能包含所有的明星和剧集。通过计算足够大的数据规模来考虑。衍生出的模型可以适用于所有的明星和戏剧。而且错误太小,无法组织。

问题重述:

  当前的中国电视市场竞争激烈,充满了不同的风格和话题。虽然每年的电视剧产量仍然很高,但电视台并没有太多的购买欲望,这导致了电视剧供过于求。数量从来都不是电视剧的问题,但质量一直是我们需要解决的问题。如何降低成本,摆脱草率粗暴的电视投资,决定着电视剧的未来发展。
  同时,利用2014年的大数据作为测试电视市场的分析工具也取得了相当成功。虽然大数据无法创建脚本,但它可以非常精确地分析数据和预测。这可以应用于剧本编写、电视收视率预测、电视广告结果和电视剧购买。可以降低电视投资风险,提高剧本质量,预测观众反应,以确保最大效益。
  在影视剧市场中,如何对影视剧进行评价和定制等问题一直是一个制作过程中关注的焦点。现在请尝试使用数学建模方法来解决以下问题。
  根据排名指数对电视剧进行排名,并说出你的前十名。
  请收集并使用相关数据作为基础,设计一个明星人气指数,并通过今年的真实例子来证明你的指数的可及性。
  描述一个理想的制作团队,包括制片人和演员。试着用一个真实的例子来证明你的观点。
  通过观看历史和节目收视率,找到最适合观众和每个地方电视台的剧本内容。收集相关数据,使用数学建模方法提供解决方案,并使用真实的例子来证明你的观点。

模型的建立与求解整体论文缩略图

在这里插入图片描述
在这里插入图片描述

全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

程序代码:

部分程序如下:
import requests
import re,json
def get_stars(url):strs = '''<span class="rank_left_name" person-id="529">Liyin 
Zhao</span><span clas'''\'''s="rank_left_value"><b class="rlv_gray">9.0814</b>'''req = requests.get(url).textpattern = r"<span.*?personid=\"\d*?\">(.*?)</span>.*?\">([\d,\.]*?)</b>"out = re.findall(pattern,req)for i in out:print i[0] + "," + i[1] # print stars so that wo can covert 
the file to a csv format.return out # return the list of stars.
def get_rank():url_1 = "http://www.xunyee.cn/rank-person-index-3.html"get_stars(url_1)length = []for i in range(2,35):url_2 = "http://www.xunyee.cn/rank-person-index-3-
page-%d.html"%(i)length.append(get_stars(url_2))return length
# the stars list
stars = [u'Zhao Liying', u'Li Yifeng', u'Lay', u'Yang Zi', u'Ma 
Tianyu', u'Yang Yang', u'Hu Ge', u'William Chan',u'Liu Tao', u'Yang Mi', u'Victoria', u'Zheng Shuang', u'Wang 
Kai', u'Tang Yan', u'Ruby Lin', u'Liu Shishi',u'Guan Xiaotong', u'Wang Ziwen', u'Wallace Huo', u'Zhang Yishan',
u'Zhangruoyun', u"Zhang Tian'ai", u'Di Ali Gerba',u'Joker', u'Cheney Chen', u'Fan Bingbing', u'Maggie Jiang',
u'Zhang Han', u'Joe Chen', u'Gulnazar', u'Honglei Sun',
u'Jiang Xin', u'Wu Lei', u'Zhang Meng', u'Hawick Lau', u'Mark', u'Qin 
Junjie', u'Juen-Kai Wang', u'Angela Baby', u'Tansongyun', u'Chenhe', u'Liu Yifei', u'YoonA', u'Song Joong 
Ki', u'Yuan Wang', u'Tangyixin', u'Wu You', u'William Feng',u'Jiangjinfu', u'Through', u'Jin Dong', u'Liuhaoran', u'Li 
Zhongshuo', u'Dongyu Zhou', u'Jackson Yi', u'Zhong Hanliang',u'Kan Kiyoko', u'Deng Chao', u'Luyi Zhang', u'Li Chen', u'Sun 
Li', u'Guo Degang', u'Liu Yan', u'Lu Yi', u'Huang Lei',u'Zhangmingen', u'Luhan', u'Ju Jingyi', u'Cheng Yi', u'Ji Chang 
Wook', u'Xiaozhan', u'Zheng Kai', u'Mao Zijun',u'Huang Xiaoming', u'Yu Hewei', u'Hai Qing', u'Luo Jin', u'Qi 
Wei', u'Huang Bo', u'Li Qin', u'Wu Xiubo',u'Xinyi Zhang', u'Qing Jia', u'Huang Haibing', u'Yuan Shanshan',
u'Jia Nailiang', u'Du Chun', u'Cary Woodworth',u'Zu Feng', u'Baishu', u'Qiao xin2', u'Zhao Wei', u'Liyan Tong',
u'Yuan Hong', u'Chen Xiao', u'Maoxiaotong',u'Qiao Zhenyu', u'Ady Ann', u'Gao Yuanyuan', u'Yang Shuo', u'Chen 
Xiang', u'Zheng Yin', u'Hye gyo Song', u'Nicky Wu',u'Wujiacheng', u'Chen yao1', u'Lee Jun-ki', u'Xiao Che', u'Zhang 
Yi', u'Huyunhao', u'Joe Cheng', u'Gilbert air',u'Baoqiang Wang', u'Janine Chang', u'Jin Chen', u'For the',
u'Eddie Peng', u'Sheenah', u'Hongchen', u'Wang Ou',u'Faye Yu', u'Sun Yi Chau', u'Pets Ceng', u'Fuchengpeng', u'Jing 
Bairan', u'Qiao Renliang', u'Show Luo', u'Wu Jing',u'Zhe Han Zhang', u'Handongjun', u'Liyitong', u'Alec Su',
u'Loura', u'Zhang Danfeng', u'Yan Ni', u'krystal',u'The white buildings', u'Guozifan', u'Houmengsha', u'Louis Koo',
u'Hubingqing', u'Park Shin Hye', u'Andy',u'Jimmy Lin', u'Pengchuyue', u'Rong Yang', u'Zifeng Zhhang',
u'Shuyaxin', u'Zhang Xinyu', u'Kris', u'Yangle',u'Yuanbingyan', u'Zhu Yawen', u'Maidina', u'Zhangxueying', u'Ng 
Cheuk Hai', u'Kelsey', u'Kyle Cui', u'Xuhaiqiao',u'Happy', u'Qian Wu', u'Jay Chou', u'Wang Xiaochen', u'Li 
Xiaoran', u'Liu Ye', u'Zhao Lei', u'Xu Doudou', u'Jiro Wang',u'Yanzidong', u'Ouyang Nana', u'Gao Yixiang', u'Benny Chan',
u'Song Jia', u'Jordan Chan', u'Bea Hayden', u'Michelle Chen',u'Yan Yi wide', u'Stephen Chow', u'Alyssa Chia', u'Ying Er',
u'Raymond Lam', u'Bosco Wong', u'Xiong Naijin', u'Hu Bing',u'Bing Shao', u'Angela Chang', u'Anita Yuen', u'Baijingting',
u'Vincent Chiao', u'Gillian Chung', u'JJ Lin', u'iu', u'Xu',u'Kenny', u'Charmaine Sheh', u'Angie Chiu', u'Tsung-Han Lee',
u'Kim Su Hyon', u'Zihan Chen', u'Yu-chi Chen', u'Ariel Lin',
u'Wang Yuexin', u'Du Haitao', u'Jiangzile', u'Chenruoxuan', u'Ma 
Sichun', u'Pubaojian', u'Niujunfeng', u'Peter Ho',u'Gujiacheng',
]
def getFansAndPosts():pattern = r"<span 
class=\"card_menNum\">([\d,\,]*?)</span>[\w\W]*?<span 
class=\"card_infoNum\">([\d,\,]*?)</span>"for i in stars:url = "http://tieba.baidu.com/f?kw=%s"%(i)# print urlreq = requests.get(url).textresult = re.findall(pattern,req)[0]# print results so that wo can covert the file to a csv 
format.print result[0].replace(',','')+','+result[1].replace(',','')
def calc(ll):out = 0;for i in ll:out += int(i)return out/len(ll)
def getIndexAndMedia():for i in stars:try:get_media_url =
"http://index.so.com/index.php?a=soMediaJson&q=%s"%imedia =
json.loads(requests.get(get_media_url).text)['data']['media'].values(
)[0].split('|')[-300:-1]get_index_url =
"http://index.so.com/index.php?a=soIndexJson&q=%s"%iindex =
json.loads(requests.get(get_index_url).text)['data']['index'].values(
)[0].split('|')[-300:-1]# calculate the average num of Media Focusavg_media = calc(media)# calculate the average num of Index.
avg_index = calc(index)# print stars so that wo can covert the file to a csv format.print str(avg_index) + "," + str(avg_media)except Exception,e:print iexit(0)
if __name__ == '__main__':getIndexAndMedia()
全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

这篇关于2016年亚太杯APMCM数学建模大赛C题影视评价与定制求解全过程文档及程序的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/318725

相关文章

idea+spring boot创建项目的搭建全过程

《idea+springboot创建项目的搭建全过程》SpringBoot是Spring社区发布的一个开源项目,旨在帮助开发者快速并且更简单的构建项目,:本文主要介绍idea+springb... 目录一.idea四种搭建方式1.Javaidea命名规范2JavaWebTomcat的安装一.明确tomcat

使用EasyPoi快速导出Word文档功能的实现步骤

《使用EasyPoi快速导出Word文档功能的实现步骤》EasyPoi是一个基于ApachePOI的开源Java工具库,旨在简化Excel和Word文档的操作,本文将详细介绍如何使用EasyPoi快速... 目录一、准备工作1、引入依赖二、准备好一个word模版文件三、编写导出方法的工具类四、在Export

java程序远程debug原理与配置全过程

《java程序远程debug原理与配置全过程》文章介绍了Java远程调试的JPDA体系,包含JVMTI监控JVM、JDWP传输调试命令、JDI提供调试接口,通过-Xdebug、-Xrunjdwp参数配... 目录背景组成模块间联系IBM对三个模块的详细介绍编程使用总结背景日常工作中,每个程序员都会遇到bu

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

Python内存管理机制之垃圾回收与引用计数操作全过程

《Python内存管理机制之垃圾回收与引用计数操作全过程》SQLAlchemy是Python中最流行的ORM(对象关系映射)框架之一,它提供了高效且灵活的数据库操作方式,本文将介绍如何使用SQLAlc... 目录安装核心概念连接数据库定义数据模型创建数据库表基本CRUD操作创建数据读取数据更新数据删除数据查

在Node.js中使用.env文件管理环境变量的全过程

《在Node.js中使用.env文件管理环境变量的全过程》Node.js应用程序通常依赖于环境变量来管理敏感信息或配置设置,.env文件已经成为一种流行的本地管理这些变量的方法,本文将探讨.env文件... 目录引言为什么使php用 .env 文件 ?如何在 Node.js 中使用 .env 文件最佳实践引

uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)

《uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)》在uni-app开发中,文件上传和图片处理是很常见的需求,但也经常会遇到各种问题,下面:本文主要介绍uni-app小程序项目中实... 目录方式一:使用<canvas>实现图片压缩(推荐,兼容性好)示例代码(小程序平台):方式二:使用uni

Python绘制TSP、VRP问题求解结果图全过程

《Python绘制TSP、VRP问题求解结果图全过程》本文介绍用Python绘制TSP和VRP问题的静态与动态结果图,静态图展示路径,动态图通过matplotlib.animation模块实现动画效果... 目录一、静态图二、动态图总结【代码】python绘制TSP、VRP问题求解结果图(包含静态图与动态图

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

JDK8(Java Development kit)的安装与配置全过程

《JDK8(JavaDevelopmentkit)的安装与配置全过程》文章简要介绍了Java的核心特点(如跨平台、JVM机制)及JDK/JRE的区别,重点讲解了如何通过配置环境变量(PATH和JA... 目录Java特点JDKJREJDK的下载,安装配置环境变量总结Java特点说起 Java,大家肯定都