《数据科学与大数据技术》讲义提纲

http://hong.xmu.edu.cn | hwx@xmu.edu.cn
(最后更新时间:2017年9月28日)

 

通过课程,您将学习到——

 

I
数据科学概述

1. 如何评价和判断新兴技术的发展?

找出2010年以来的Gartner(高德纳、顾能)曲线及其分析报告,做出你自己的理解和判断。

2.用图表解释云计算、大数据、物联网和人工智能的关系。

3.什么是技术路线图?

画出大数据研究的技术路线图,说明各个环节的典型科学研究问题,分别引用一篇优秀论文来说明这个问题。

4.大数据应用适合于哪些领域?

介绍1-2个成功的大数据应用案例,模仿这些案例,设计和畅想1个大数据应用场景,分析设计的可行性。

5.什么是大数据产业地图?

查找全球及国内各省市的大数据产业规划,找出相应的大数据产业地图,解读这些产业地图。

 

II
大数据应用

 

6.案例分析:健康医疗大数据应用平台。

请行业专家介绍健康医疗大数据的研究现状。请学生基于厦门市健康医疗大数据产业协作平台(www.healthcare-toolkit.com)进行数据分析和商业模式探索。

7.案例分析:金融大数据应用平台。

请行业专家介绍证券金融大数据的研究现状,请学生基于金融大师(www.master-rong.com)进行数据分析和商业模式探索。

8.案例分析:集成电路保税交易平台。

请行业专家介绍电子商务大数据的研究现状,请学生基于交易平台(www.xmictc.com)进行数据分析和商业模式探索。

9.案例分析:iHR+ 智能人才招聘系统。

 

III
技术与工具

 

10.数据库原理与技术综述。

11.SAS 入门和实践。

12.R入门和实践。

13.Python入门和实践。

14.Hadoop、Spark入门和实践。

15.Tableau等可视化工具入门和实践。

 

IV
产业生态

 

16.百度AI开放平台(http://ai.baidu.com/

17.阿里云入门和实践(https://www.aliyun.com

18.腾讯大数据(http://bigdata.qq.com

19.微软Azure云入门和实践(https://www.azure.cn

20.思科dev.net入门和实践(https://developer.cisco.com

 

 

数据集

(最后更新时间:2017年9月28日)

 

# 数据集 数据量(条) 获取时间
1 豆瓣电影数据 56084 2017.02
2 厦大新闻网访问日志 84989138 2004.11-2014.02
3 享项项目数据 29998 2016.06
4 享项新闻数据 5033 2016.01-2016.06
5 厦门大学论文信息数据 26043 2006-2016
6 金融新闻数据 288162 2008.01-2017.03
7 上市公司基本数据 3170 2017.02
8 上市公司高管信息数据 90596 2017.02
9 上市公司主营业务构成数据 129832 2017.02