科研民工计划和路,都是从了解 python3 基本语法并且只了解 python3 基本语法开始。。。
科研民工计划
0、 前言
- 总共有三步:机器学习 -> 深度学习 -> 医学图像重建,每一步应该都包含对应的数学知识和 python 常用的库/框架。
- 虽然是三步,但并不是走完第一步再走完第二步再走完第三步这样子,而是三个同时进行。
- 但是要有侧重点,比如第一阶段就是机器学习为主,另外两个为辅。其他也一样。
- 时间有限,所以数学知识切记不要扎进去,点到为止,千万千万要克制住自己的好奇心。等到以后稳定了再慢慢想慢慢看。
- 同理 python 常用的库/框架也是,会用为主,用的多的有疑问的去扫两眼源码就行了,同样千万不要沉迷于源码上。
- 碰到某某算法,一定要理解透并复现,这也就是不让在前面数学知识和 python 框架上深究的原因,研究生阶段重点是在一个个算法上,而不是搞开发了。
1、 机器学习
1.1、 数学部分
- 《统计学方法》pdf(李航):ipad 上都放了半年了,该看了,但是不要指望第一次就能全懂,泛读为主
1.2、 python 库/框架
有篇很好的说明博客:Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料
1.2.1、 Numpy:
- 基于菜鸟教程中的 NumPy 教程。
1.2.2、 Matplotlib:
1.2.3、 Pandas:
- ant-learn-pandas 跑了前12讲,将 Pandas 理解成数据库就行了,所以后面表连接的操作之后就没看,用到的时候再来查。
1.2.5、 scipy 和 sklearn:
- 暂定
1.3、 机器学习常见的算法
好好学好好记好好理解好好复现。
- B站吴恩达:不用多bb。后续自己实现的课后作业都会放在 Github 上:Coursera-ML-AndrewNg-myNote
- 《机器学习》pdf(周志华):西瓜书,同样不用多bb,ipad上都快放的长毛了。
2、 深度学习
2.1、 数学部分
待定
2.2、 python 库/框架
tensflow 和 pytorch,具体待定
2.3、 深度学习常见的算法
- B站吴恩达-深度学习视频 ,相关的作业和数据集等之后写完再补上。
3、 医学图像重建
3.1、 数学部分
3.2、 python 库/框架
待定
3.3、 医学图像重建常见的算法
待定
科研民工之路
2021-1-11
当前:
接下来:
- 初步理解了线性回归以及线性回归中的梯度下降之后,应该用 Python 去复现它。不过在此之前应该先了解一下 Python 中相关的包:孙兴华中文讲Python数据分析三部曲入门篇 Numpy教程 Pandas教程 Matplotlib教程
2021-1-13
当前:
- 初步了解了 Python 中的 Numpy、Matplotlib、Pandas 三个类库,不过并没有按照之前的看孙兴华的,而是找的其他教程看的:
- 基于菜鸟教程中的 NumPy 教程。
- Python 笔记:最全Matplotlib 入门教程:前七章。
- NumPy Matplotlib - 菜鸟教程。
- ant-learn-pandas 跑了前12讲,将 Pandas 理解成数据库就行了,所以后面表连接的操作之后就没看,用到的时候再来查。
- 了解到还需要学习的基本类库是 scipy 和 sklearn,但是 sklearn 是将当前常见的机器学习算法封装的一个类库,而吴恩达的机器学习就是说明这些算法怎么来的。所以后续在实现每一个算法的时候要有非sklearn的版本(自己写底层原理但只是用来理解的和sklearn的版本(以后实际用到的),所以每一个的sklearn算法等到了具体的某个算法的时候再学。
- 另外吴恩达的视频中提到会有课后作业,所以现在也不要想着复现第二章的代码,安安静静等课后作业吧。
- 后续自己实现的课后作业都会放在 Github 上:Coursera-ML-AndrewNg-myNote
接下来:
- 继续往后看B站吴恩达,从12p开始(第三章)。
2021-1-19
当前:
- 目前看到B站吴恩达,从31p结束(第五章结束)并且作业 ex1_Linear_Regression 完成。
- 作业ex1 完成期间意识到自己的 python 及其常用类库还很不熟练,导致作业ex1写了好几天才完成,所以后续还需要多加练习。
- 不过这也算是自己学会的第一个机器学习算法了。
接下来:
- 继续往后看B站吴恩达,从32p开始(第六章)。
2021-1-25
当前:
- 目前看到B站吴恩达,从42p结束(第七章结束)并且作业 ex2_Logistic_Regression 完成。
- 作业 ex2 完成期间意识到自己的 python 及其常用类库比起 ex1 的时候娴熟了许多。后面再继续多练吧。
接下来:
- ex2 中并没有涉及到多元分类,而是在 ex3 中,所以先打算将 ex3 中的多元分类部分完成然后再往后看新的内容
2021-1-26
当前:
- ex3 的 part1 部分(多元分类)搞定。
接下来:
- 继续往后看B站吴恩达,从43p开始(第八章)。
2021-1-29
当前:
- 目前看到B站吴恩达 第49p结束(第八章结束),并且ex3 剩下的 part 2部分搞定。
接下来:
- 继续往后看B站吴恩达,从50p开始(第九章)。
2021-2-3
当前:
- 目前看到B站吴恩达 第57p结束(第九章结束),并且完成 ex4。
- 虽然完成了作业,但是神经网络尤其是反向传播算法还是很模糊,以后肯定还会多次用到这玩意的,希望到时候用到的时候理解能更加深刻吧。
- 关于相关的数学公式推导,我参考了这个视频。
接下来:
- 继续往后看B站吴恩达,从58p开始(第十章)。
2021-2-10
当前:
- 目前看到B站吴恩达 第64p结束(第十章结束),并且完成 ex5。
接下来:
- 继续往后看B站吴恩达,从65p开始(第十一章)。
- 不过先过年,过完年再继续,过年期间使劲耍~
2021-2-22
当前:
- 过了个年,从 2-20 开始看的书
- 目前看到B站吴恩达 第75p结束(第十二章结束),并且完成 ex6。
- 但是 SVM 一点都没理解,每一小节都听得很懵逼,并且练习题并没有让自己仿写一个SVM而是直接用的类库,所以也没有加深理解。SVM以后还得找其他资料再重新看重新学。
接下来:
- 继续暂停,要准备期末考试了。考完再回来接着看。
2021-3-14
当前:
- 考完了试,从3-7 开始看的书
- 目前看到B站吴恩达 第87p结束(第十四章结束),并且完成 ex7。
- K-means 和 PCA 理解的还算可以
接下来:
- 继续往后看B站吴恩达,从88p开始(第十五章)。
2021-3-21
当前:
- 目前看到B站吴恩达 第101p结束(第十六章结束),并且完成 ex8。
- 异常检测 和 推荐算法 理解的还算可以,推荐算法最后留了一个小问题:我用 Y 训练的效果比归一化之后的效果好。。这应该是不正常的,但是参考答案也和我有一样的问题,不清楚哪出问题了。
接下来:
- 继续往后看B站吴恩达,从102p开始(第十七章)。
2021-3-22
当前:
- B站吴恩达 的机器学习完结撒花~
- 将 Github:机器学习的课后题 进行最后的整理,完善。
接下来:
- 继续看吴恩达的深度学习的视频课,具体的等会找到在来补充
2021-4-1
当前:
- 目前看到B站吴恩达-深度学习 第43p结束(第一部分结束),并且完成第一部分的四周的练习题。
- 对神经网络有更清晰的认识,相比与之前机器学习部分的神经网络,这里将的更细更好接受。真心强烈建议跟着视频推导一边。
接下来:
- 继继续往后看B站吴恩达-深度学习 ,从44p开始(第二部分)。
- 前几p的视频是对该领域大牛的采访,可以抽出空闲时间来看。
2021-4-11
当前:
- 目前看到B站吴恩达-深度学习 第83p结束(第二部分结束),并且完成第二部分的每周的练习题。
- 开始使用 tensorflow 了,如果用 1.x(测试用的1.8.0)那么运行结果和参考答案完全一样,并且也不需要因为版本不同而改方法,但是缺点是实验室的服务器CUDA是11.0(不支持 TF 1.x),而且1.x毕竟是旧版本。
- 如果是2.x版本那么可以用GPU跑并且也是新版本,但是需要改的东西比较多而且结果和参考答案不太一样。
- 纠结了半天,还是选择了2.4版本的Tensorflow(安装命令:
pip install tensorflow-gpu==2.4 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
)。 - 另外以后的主力框架更倾向与 pytorch
接下来:
- 继继续往后看B站吴恩达-深度学习 ,从84p开始(第三部分)。
- 前几p的视频是对该领域大牛的采访,可以抽出空闲时间来看。
2021-4-12
当前:
- 目前看到B站吴恩达-深度学习 第106p结束(第三部分结束),但是第三部分没有编程练习。
- part 3 讲的更多的是在搭建好网络之后应该如何优化,目前来说还没达到内个层次,也没有相应的编程练习用来练手,所以基本是一代而过的,以后如果涉及到优化再回来细看
接下来:
- 继继续往后看B站吴恩达-深度学习 ,从107p开始(第四部分)。
- 前几p的视频是对该领域大牛的采访,可以抽出空闲时间来看。
2021-4-19
当前:
- 目前看到B站吴恩达-深度学习 第118p结束(第四部分第一周结束)。
- 从第四部分就开始讲各种常见的网络了,这一周讲了基本的CNN,因为很重要,所以mark下。
接下来:
- 继继续往后看B站吴恩达-深度学习 ,从119p开始(第四部分第二周)
2021-4-22
当前:
- 目前看到B站吴恩达-深度学习 第129p结束(第四部分第二周结束)。
- 视频讲了常见的cnn网络,包括 LeNet, AlexNet,VGG 以及 ResNet 。然后练习要求了解Keras 框架。
- 遗憾的是个人认为练习中的量不够,只有最基本的 Keras 框架以及用 Keras 搭建 ResNet。其他的都没有练习。不过自己已经定了之后主力框架是 PyTorch,那就之后看论文的时候用 PyTorch 复现吧。
接下来:
- 继继续往后看B站吴恩达-深度学习 ,从130p开始(第四部分第三周)
2021-4-23
当前:
- 目前看到B站吴恩达-深度学习 第139p结束(第四部分第三周结束)。
- 视频讲了目标检测以及YOLO算法,并且练习很充分。
- 练习我没做第三部分,原因是TF版本高了需要降回到1.4,嫌麻烦就没做。
接下来:
- 继继续往后看B站吴恩达-深度学习 ,从140p开始(第四部分第四周)
2021-4-26
当前:
- 目前看到B站吴恩达-深度学习 第150p结束(第四部分结束)。
- 视频讲了人脸识别和神经风格迁移,146p必看!!!,对理解深度卷积网络在干什么很有帮助。
- 练习神经风格迁移没做最后一部分,原因是TF版本高了需要降回到1.4,嫌麻烦就没做。
接下来:
- 继续往后看B站吴恩达-深度学习 ,从151p开始(第五部分)
2021-4-29
当前:
- 暂停到第四部分结束吧。后面不看了,RNN和NLP对现阶段用处不大,以后再说
接下来:
还需要补的东西:
- 网络:unet,GAN,Transformer
- 框架:keras,pytorch
找视频过一遍 keras和pytorch。之后就开始看论文吧,上面提到的网络等看到相关论文的时候复现就行了。
- 追:动手学深度学习了 了,正好今年 3月20号 开始讲第二版基于 PyTorch 的。
- 今天学到的第一个点:利用 ssh -L 代理来访问远程启动的
jupyter
,命令为:ssh -p 56889 -L8000:localhost:8000 lirunrui@101.7.172.229
-L:将远端的8000端口映射到本地的8000端口,之所以是8000那是因为我jupyter默认改成了8000了。
文档信息
- 本文作者:MikasaLee
- 本文链接:/2021/01/09/MachineLearning/
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)