案例Python爬虫数据处理实验要求:实验报告要求
当前位置:以往案例 > >案例Python爬虫数据处理实验要求:实验报告要求
2018-09-25

2016级数字媒体技术专业2016-2017学年夏学期实验报告要求

2016数字媒体技术专业1-3班的夏学期课程安排为程序设计拓展实训要求两人一组进行项目实践:每班各24组,共72组。要求从有关网站上爬取与山西文化、旅游景点、民俗、民间故事、特色小吃等有关的文字或图片数据,然后把数据以合适的方式进行可视化。每班最多有两组可以主题相同,考核需要提交一份实验报告,共分为六部分,具体要求如下:

一、数据采集

该部分需要说明数据的主题及意义,数据来源(网址),数据描述(字段、类型(时间、文本))、数据爬取方法(文字,截图)。要求采集的数据不少于四个字段,至少一千页内容,字段名使用英文,字段描述清晰。

二、数据处理

数据处理要求生成CSVExcel格式或将凌乱的txt格式转化为结构化的CSVExcel格式,可以采取自动方式(推荐)和手动方式。自动方式:详细描述处理过程中用了那种语言,用了什么方法(如文件读取、字符串操作)。手动方式:详细描述方法,步骤。最后说明处理过程中遇到什么问题,怎么解决的。

三、设计任务

列出需要使用可视化来分析什么任务(不得少于三个任务,可以从时间、空间、语义角度来看)。比如:想看山西面食在不同地域的分布情况,或者是民间故事主要反映什么主题,比如爱情、神话。

四、可视化设计

可视化可以采用以下形式:比如柱状图,地图、词云、条形图、气泡图、平行坐标、日历图、折线图、饼图、散点图、热图、也可以自行设计独特的可视化形式图。建议对数据进行多角度分析,设计多种可视化形式。要求对每种可视化中的编码方式进行描述,比如:用颜色表示国家、用线宽或柱高表示人数、用形状表示不同文化的类型等。

五、可视化工具

说明选用了哪种可视化工具:比如EcharthighcharttableauExcelD3等(可以结合工具特点和数据特点同时使用多种工具),简单描述可视化工具的使用过程。

六、分析评估

描述自己可视化项目中可以得出的结论。比如说:垃圾短信时间分布上呈现双峰特性;空间主要分布在北京市四环区域;民间故事很多反映的是神话、爱情等主题。

保证80分以上,保证通过,保证质量,保证辅导。


u=199783060,2774173244&fm=58&s=188FA15AB1206D1108400056000040F6&bpow=121&bpoh=75.jpgalipay_pay_96px_533896_easyicon.net.pngpaypal_96px_533937_easyicon.net.pngchina_union_pay_96px_533911_easyicon.net.pngmastercard_pay_96px_533931_easyicon.net.pngasia_pay_96px_533902_easyicon.net.png

本网站支持淘宝 支付宝 微信支付  paypal等等交易。如果不放心可以用淘宝或者Upwork交易!

E-mail:[email protected] 微信:csghostwriting  工作时间:无休息工作日-早上8点到凌晨3点


如果您用的手机请先保存二维码到手机里面,识别图中二维码。如果用电脑,直接掏出手机果断扫描。


在线提交订单