CS Notes
  • CS-Notes文档说明
  • 机器学习
    • 频率派和贝叶斯学派
    • 机器学习中的分类指标
    • 数学基础
    • 数据清洗
    • SVM
    • 线性模型
    • 拉格朗日乘子法和KKT条件
    • 集成学习
    • 贝叶斯分类器
    • 降维和度量学习
    • 决策树
    • 神经网络
    • 神经网络优化器
    • Autoencoders & GANs
    • IoU
    • EM算法
    • ML问题总结
    • 机器学习&深度学习学习资料汇总
    • 如何阅读论文
    • 如何写好一篇论文
  • 语言、算法相关
    • 背包问题 - 01背包&完全背包
    • 平衡二叉树AVL
    • 红黑树RB-Tree
    • STL容器
    • STL 常用算法
    • Markdown总结
    • 问题总结
    • 代码汇总
    • PAT手册
  • MIT 6.828 OS课程
  • ImGui
Powered by GitBook
On this page
  • matplotlib总结
  • Numpy总结
  • stack, vstack, hstack
  • range和np.arange的区别
  • Pandas
  • 打印juypter运行时间

Was this helpful?

  1. 机器学习

ML问题总结

matplotlib总结

显示中文需要添加:

import matplotlib as plt
plt.rcParams['font.sas-serig']=['SimHei'] # 用来正确显示中文标签
plt.rcParams['axes.unicode_minus']=False # 用来争取显示正负号

Numpy总结

np.r是按列连接两个矩阵,就是把两矩阵上下相加,要求列数相等,类似于pandas中的concat()。 np.c是按行连接两个矩阵,就是把两矩阵左右相加,要求行数相等,类似于pandas中的merge()。

stack, vstack, hstack

ref: https://cloud.tencent.com/developer/article/1378491

range和np.arange的区别

ref: https://blog.csdn.net/lanchunhui/article/details/49493633

Pandas

使用read_csv读入文件的时候,访问的方式不同得到的变量的类型不同

import pandas as pd
data = pd.read_csv('train.csv')
data['occupation']     # 返回的格式是:pandas.core.series.Series
data[['occupation']]   # 返回的格式是:pandas.core.frame.DataFrame

判断一个数据内容是否为空

import pandas as pd
import numpy as np
x = np.nan
# x = pd.NA
pd.isnull(x)

创建一个新的DataFrame变量,增加新的一行数据

import pandas as pd
df = pd.DataFrame([],columns=['one','two'])  
# df = df.append才可以生效,直接是df.append不可以
# ignore_index=True,表示的是让index从0开始依次递增
df = df.append([{'one':10.0, 'two': 90}],ignore_index = True)
df.append([{'one':"11.0", 'two': 90}], ignore_index = True)

Series变量如何reshape

# data['China'] # 假定该变量为Series类型
# reshape的方式如下, .values得到的是一个ndarray
data['China'].values.reshape(-1, 1)

打印juypter运行时间

magic函数 magic有行魔法%time 和单元魔法%%time

PreviousEM算法Next机器学习&深度学习学习资料汇总

Last updated 5 years ago

Was this helpful?