python 科研民工之路

2021/01/09 python 共 4709 字,约 14 分钟

科研民工计划和路,都是从了解 python3 基本语法并且只了解 python3 基本语法开始。。。

科研民工计划

0、 前言

  • 总共有三步:机器学习 -> 深度学习 -> 医学图像重建,每一步应该都包含对应的数学知识python 常用的库/框架
  • 虽然是三步,但并不是走完第一步再走完第二步再走完第三步这样子,而是三个同时进行。
  • 但是要有侧重点,比如第一阶段就是机器学习为主,另外两个为辅。其他也一样。
  • 时间有限,所以数学知识切记不要扎进去,点到为止,千万千万要克制住自己的好奇心。等到以后稳定了再慢慢想慢慢看。
  • 同理 python 常用的库/框架也是,会用为主,用的多的有疑问的去扫两眼源码就行了,同样千万不要沉迷于源码上
  • 碰到某某算法,一定要理解透并复现,这也就是不让在前面数学知识和 python 框架上深究的原因,研究生阶段重点是在一个个算法上,而不是搞开发了。

1、 机器学习

1.1、 数学部分

  • 《统计学方法》pdf(李航):ipad 上都放了半年了,该看了,但是不要指望第一次就能全懂,泛读为主

1.2、 python 库/框架

有篇很好的说明博客:Numpy、Pandas、SciPy、Scikit-Learn、Matplotlib的关系以及学习资料

1.2.1、 Numpy:

1.2.2、 Matplotlib:

1.2.3、 Pandas:

  • ant-learn-pandas 跑了前12讲,将 Pandas 理解成数据库就行了,所以后面表连接的操作之后就没看,用到的时候再来查。

1.2.5、 scipy 和 sklearn:

  • 暂定

1.3、 机器学习常见的算法

好好学好好记好好理解好好复现。

  • B站吴恩达:不用多bb。后续自己实现的课后作业都会放在 Github 上:Coursera-ML-AndrewNg-myNote
  • 《机器学习》pdf(周志华):西瓜书,同样不用多bb,ipad上都快放的长毛了。

2、 深度学习

2.1、 数学部分

待定

2.2、 python 库/框架

tensflow 和 pytorch,具体待定

2.3、 深度学习常见的算法

3、 医学图像重建

3.1、 数学部分

3.2、 python 库/框架

待定

3.3、 医学图像重建常见的算法

待定



科研民工之路

2021-1-11

当前:

接下来:

2021-1-13

当前:

  • 初步了解了 Python 中的 Numpy、Matplotlib、Pandas 三个类库,不过并没有按照之前的看孙兴华的,而是找的其他教程看的:
  • 了解到还需要学习的基本类库是 scipy 和 sklearn,但是 sklearn 是将当前常见的机器学习算法封装的一个类库,而吴恩达的机器学习就是说明这些算法怎么来的。所以后续在实现每一个算法的时候要有非sklearn的版本(自己写底层原理但只是用来理解的sklearn的版本(以后实际用到的),所以每一个的sklearn算法等到了具体的某个算法的时候再学。
  • 另外吴恩达的视频中提到会有课后作业,所以现在也不要想着复现第二章的代码,安安静静等课后作业吧。
  • 后续自己实现的课后作业都会放在 Github 上:Coursera-ML-AndrewNg-myNote

接下来:

2021-1-19

当前:

  • 目前看到B站吴恩达,从31p结束(第五章结束)并且作业 ex1_Linear_Regression 完成。
  • 作业ex1 完成期间意识到自己的 python 及其常用类库还很不熟练,导致作业ex1写了好几天才完成,所以后续还需要多加练习。
  • 不过这也算是自己学会的第一个机器学习算法了。

接下来:

2021-1-25

当前:

  • 目前看到B站吴恩达,从42p结束(第七章结束)并且作业 ex2_Logistic_Regression 完成。
  • 作业 ex2 完成期间意识到自己的 python 及其常用类库比起 ex1 的时候娴熟了许多。后面再继续多练吧。

接下来:

  • ex2 中并没有涉及到多元分类,而是在 ex3 中,所以先打算将 ex3 中的多元分类部分完成然后再往后看新的内容

2021-1-26

当前:

  • ex3 的 part1 部分(多元分类)搞定。

接下来:

2021-1-29

当前:

  • 目前看到B站吴恩达 第49p结束(第八章结束),并且ex3 剩下的 part 2部分搞定。

接下来:

2021-2-3

当前:

  • 目前看到B站吴恩达 第57p结束(第九章结束),并且完成 ex4。
  • 虽然完成了作业,但是神经网络尤其是反向传播算法还是很模糊,以后肯定还会多次用到这玩意的,希望到时候用到的时候理解能更加深刻吧。
  • 关于相关的数学公式推导,我参考了这个视频

接下来:

2021-2-10

当前:

  • 目前看到B站吴恩达 第64p结束(第十章结束),并且完成 ex5。

接下来:

  • 继续往后看B站吴恩达,从65p开始(第十一章)。
  • 不过先过年,过完年再继续,过年期间使劲耍~

2021-2-22

当前:

  • 过了个年,从 2-20 开始看的书
  • 目前看到B站吴恩达 第75p结束(第十二章结束),并且完成 ex6。
  • 但是 SVM 一点都没理解,每一小节都听得很懵逼,并且练习题并没有让自己仿写一个SVM而是直接用的类库,所以也没有加深理解。SVM以后还得找其他资料再重新看重新学。

接下来:

  • 继续暂停,要准备期末考试了。考完再回来接着看。

2021-3-14

当前:

  • 考完了试,从3-7 开始看的书
  • 目前看到B站吴恩达 第87p结束(第十四章结束),并且完成 ex7。
  • K-means 和 PCA 理解的还算可以

接下来:

2021-3-21

当前:

  • 目前看到B站吴恩达 第101p结束(第十六章结束),并且完成 ex8。
  • 异常检测 和 推荐算法 理解的还算可以,推荐算法最后留了一个小问题:我用 Y 训练的效果比归一化之后的效果好。。这应该是不正常的,但是参考答案也和我有一样的问题,不清楚哪出问题了。

接下来:

  • 继续往后看B站吴恩达,从102p开始(第十七章)。

2021-3-22

当前:

接下来:

  • 继续看吴恩达的深度学习的视频课,具体的等会找到在来补充

2021-4-1

当前:

  • 目前看到B站吴恩达-深度学习 第43p结束(第一部分结束),并且完成第一部分的四周的练习题。
  • 对神经网络有更清晰的认识,相比与之前机器学习部分的神经网络,这里将的更细更好接受。真心强烈建议跟着视频推导一边。

接下来:

  • 继继续往后看B站吴恩达-深度学习 ,从44p开始(第二部分)。
  • 前几p的视频是对该领域大牛的采访,可以抽出空闲时间来看。

2021-4-11

当前:

  • 目前看到B站吴恩达-深度学习 第83p结束(第二部分结束),并且完成第二部分的每周的练习题。
  • 开始使用 tensorflow 了,如果用 1.x(测试用的1.8.0)那么运行结果和参考答案完全一样,并且也不需要因为版本不同而改方法,但是缺点是实验室的服务器CUDA是11.0(不支持 TF 1.x),而且1.x毕竟是旧版本。
  • 如果是2.x版本那么可以用GPU跑并且也是新版本,但是需要改的东西比较多而且结果和参考答案不太一样。
  • 纠结了半天,还是选择了2.4版本的Tensorflow(安装命令:pip install tensorflow-gpu==2.4 -i http://pypi.douban.com/simple --trusted-host pypi.douban.com)。
  • 另外以后的主力框架更倾向与 pytorch

接下来:

  • 继继续往后看B站吴恩达-深度学习 ,从84p开始(第三部分)。
  • 前几p的视频是对该领域大牛的采访,可以抽出空闲时间来看。

2021-4-12

当前:

  • 目前看到B站吴恩达-深度学习 第106p结束(第三部分结束),但是第三部分没有编程练习。
  • part 3 讲的更多的是在搭建好网络之后应该如何优化,目前来说还没达到内个层次,也没有相应的编程练习用来练手,所以基本是一代而过的,以后如果涉及到优化再回来细看

接下来:

  • 继继续往后看B站吴恩达-深度学习 ,从107p开始(第四部分)。
  • 前几p的视频是对该领域大牛的采访,可以抽出空闲时间来看。

2021-4-19

当前:

  • 目前看到B站吴恩达-深度学习 第118p结束(第四部分第一周结束)。
  • 从第四部分就开始讲各种常见的网络了,这一周讲了基本的CNN,因为很重要,所以mark下。

接下来:

2021-4-22

当前:

  • 目前看到B站吴恩达-深度学习 第129p结束(第四部分第二周结束)。
  • 视频讲了常见的cnn网络,包括 LeNet, AlexNet,VGG 以及 ResNet 。然后练习要求了解Keras 框架。
  • 遗憾的是个人认为练习中的量不够,只有最基本的 Keras 框架以及用 Keras 搭建 ResNet。其他的都没有练习。不过自己已经定了之后主力框架是 PyTorch,那就之后看论文的时候用 PyTorch 复现吧。

接下来:

2021-4-23

当前:

  • 目前看到B站吴恩达-深度学习 第139p结束(第四部分第三周结束)。
  • 视频讲了目标检测以及YOLO算法,并且练习很充分。
  • 练习我没做第三部分,原因是TF版本高了需要降回到1.4,嫌麻烦就没做。

接下来:

2021-4-26

当前:

  • 目前看到B站吴恩达-深度学习 第150p结束(第四部分结束)。
  • 视频讲了人脸识别和神经风格迁移,146p必看!!!,对理解深度卷积网络在干什么很有帮助
  • 练习神经风格迁移没做最后一部分,原因是TF版本高了需要降回到1.4,嫌麻烦就没做。

接下来:

2021-4-29

当前:

  • 暂停到第四部分结束吧。后面不看了,RNN和NLP对现阶段用处不大,以后再说

接下来:

还需要补的东西:

  • 网络:unet,GAN,Transformer
  • 框架:keras,pytorch

找视频过一遍 keras和pytorch。之后就开始看论文吧,上面提到的网络等看到相关论文的时候复现就行了。

  • 追:动手学深度学习了 了,正好今年 3月20号 开始讲第二版基于 PyTorch 的。
  • 今天学到的第一个点:利用 ssh -L 代理来访问远程启动的jupyter,命令为:
    ssh -p 56889 -L8000:localhost:8000 lirunrui@101.7.172.229
    

    -L:将远端的8000端口映射到本地的8000端口,之所以是8000那是因为我jupyter默认改成了8000了。

文档信息

Search

    Table of Contents