你将收获

使用scikit-learn用流行的数据集完成机器学习研究;使用Seaborn和Matplotlib完成数据可视化和探索;用k-近邻分类和线性回归完成有监督机器学习;对Digits数据集完成多分类任务;将数据集划分为训练集、测试集和验证集;用k-折交叉验证调整超参数;模型性能度量;显示混淆矩阵来呈现分类预测正确率和错误率;对加州房屋数据集完成多重线性回归;利用PCA和t-SNE对Iris 和Digits数据集进行降维,为二维可视化做准备;用k-均值聚类和Iris 数据集完成无监督机器学习。

什么是神经网络,另外神经网络如何支持深度学习;创建 Keras神经网络;Keras 层、激活函数、损失函数和优化器;使用MNIST数据集上训练的一个Keras卷积神经网络(CNN)构建一个可以识别手写数字的计算机视觉应用;使用IMDb数据集上训练的一个Keras循环神经网络(RNN) 创建一个情感分析应用,对正面和负面电影评论完成二元分类。

使用SQL管理SQLite关系数据库;理解4种主要类型的NoSQL数据库;将推文存储在一个MongoDB NoSQL JSON 文档数据库中,并在一个Folium地图上实现可视化;Apache Hadoop以及如何用于大数据批处理应用;基于Microsoft的Azure HDInsight云服务构建一个Hadoop MapReduce应用;Apache Spark以及如何用于高性能实时大数据应用;使用Spark steaming处理小批量数据;物联网(IoT) 和发布/订阅模型;从一个模拟连接互联网的设备发布消息,并在仪表板中实现消息可视化;订阅PubNub的抽样实时流并实现数据可视化。初学者和中级

适用人群

初学者和中级

课程介绍

Paul Deitel讲授的Python基础视频课程是一个面向代码的Python演示课程,Python是当今世界上最流行、发展最迅速的语言之一。从单个代码段到完整的脚本,通过丰富的实际代码示例,Paul演示了如何使用交互式IPython解释器和Jupyter Notebook编写Python代码。你会很快熟悉Python语言、它的常用编程方法、关键的Python标准库模块以及一些流行的开源库。在每一部分最后的“数据科学介绍”视频中,Paul为后面的课程奠定了基础。在后面的那些高阶课程中,他会介绍当今最吸引人的前沿计算技术,包括自然语言处理、Twitter®数据挖掘来完成情感分析、使用IBM® Watson™的认知计算、使用分类和回归的有监督学习、使用聚类的无监督学习、通过深度学习和卷积神经网络实现计算机视觉、通过使用循环神经网络的深度学习完成情感分析、使用Hadoop®Spark™ streamingNoSQL数据库和物联网实现大数据应用。

课程目录