使用scikit-learn用流行的数据集完成机器学习研究;使用Seaborn和Matplotlib完成数据可视化和探索;用k-近邻分类和线性回归完成有监督机器学习;对Digits数据集完成多分类任务;将数据集划分为训练集、测试集和验证集;用k-折交叉验证调整超参数;模型性能度量;显示混淆矩阵来呈现分类预测正确率和错误率;对加州房屋数据集完成多重线性回归;利用PCA和t-SNE对Iris 和Digits数据集进行降维,为二维可视化做准备;用k-均值聚类和Iris 数据集完成无监督机器学习。
什么是神经网络,另外神经网络如何支持深度学习;创建 Keras神经网络;Keras 层、激活函数、损失函数和优化器;使用MNIST数据集上训练的一个Keras卷积神经网络(CNN)构建一个可以识别手写数字的计算机视觉应用;使用IMDb数据集上训练的一个Keras循环神经网络(RNN) 创建一个情感分析应用,对正面和负面电影评论完成二元分类。
使用SQL管理SQLite关系数据库;理解4种主要类型的NoSQL数据库;将推文存储在一个MongoDB NoSQL JSON 文档数据库中,并在一个Folium地图上实现可视化;Apache Hadoop以及如何用于大数据批处理应用;基于Microsoft的Azure HDInsight云服务构建一个Hadoop MapReduce应用;Apache Spark以及如何用于高性能实时大数据应用;使用Spark steaming处理小批量数据;物联网(IoT) 和发布/订阅模型;从一个模拟连接互联网的设备发布消息,并在仪表板中实现消息可视化;订阅PubNub的抽样实时流并实现数据可视化。初学者和中级