Python資料分析相關書籍閱讀摘要 - 持續更新中

1.Python for Data Analysis

  • IPython,NumPy,Pandas的基本操作
  • 資料前處理:清洗,合併…….
  • 用Matplotlib進行資料視覺化
  • 資料分類、NaN遺失值處理
  • 時間序列資料
  • 附錄是Python的語法教學

GitHub的Repo:https://github.com/wesm/pydata-book

線上翻譯版:https://seancheney.gitbook.io/python-for-data-analysis-2nd/

2.Data Visualization with Python and JavaScript

  • 用Scrapy抓資料、用Pandas處理資料、用Matplotlib和Pandas探索資料、用Flask來將資料呈現在網頁中、用D3.js來美化資料於網頁上的呈現
  • 介紹JavaScript和Python的不同與語法操作
  • 讀取CSV,JSON,SQL格式
  • 基本的Web網頁開發知識介紹:HTML、CSS......
  • 讀取Google表單、Twitter中的資料
  • Scrapy、BeautifulSoup 與lxml的搭配使用
  • NumPy, Pandas, Matplotlib的使用介紹
  • 用Flask架設網站APP、測試並且佈署至雲端
  • 使用D3.js美化資料

GitHub的Repo: https://github.com/Kyrand/dataviz-with-python-and-js

https://github.com/dyoung418/dataviz-python-js

3.Foundations for Analytics with Python

  • 每個章節都有習題,書末有解答
  • Python基礎入門
  • CSV, Excel,SQL的檔案讀寫
  • Matplotlib, Pandas, ggplot, seaborn的資料視覺化
  • 將統計學理論用Python實作
  • 使用Task Scheduler進行程式自動化執行
  • 延伸學習內容 : NumPy, Scipy, Scikit-Learn模組、資料結構

GitHub的Repo:https://github.com/cbrownley/foundations-for-analytics-with-python

4.Introduction to Data Science -A Python Approach to Concepts, Techniques and Applications

  • 基本的資料操作:讀取、選擇、過濾、處理遺失值、排列、分群、繪圖
  • 統計學理論Python實作
  • 監督式學習、非監督式學習
  • 迴歸分析
  • 神經網絡分析
  • 推薦系統
  • 自然語言處理
  • 平行計算

GitHub的Repo:https://github.com/DataScienceUB/introduction-datascience-python-book

5.Learning Data Mining with Python

  • Scikit-Learn機器學習的操作使用

GitHub的Repo:https://github.com/PacktPublishing/Learning-Data-Mining-with-Python

6.Learning pandas - Second Edition

  • 針對Pandas作詳細操作使用

GitHub的Repo:https://github.com/PacktPublishing/Learning-Pandas-Second-Edition

7.Python Data Science Essentials 3rd

  • 常用資料科學模組介紹
    NumPy
    SciPy
    pandas
    pandas-profiling
    Scikit-learn
    Jupyter
    JupyterLab
    Matplotlib
    Seaborn
    Statsmodels
    Beautiful Soup
    NetworkX
    NLTK
    Gensim
    PyPy
    XGBoost
    LightGBM
    CatBoost
    TensorFlow
    Keras
  • 較偏向資料科學理論的程式實踐
  • 機器學習、深度學習
  • Spark

GitHub的Repo:https://github.com/PacktPublishing/Python-Data-Science-Essentials-Third-Edition

8.Python Data Science Handbook(Python資料科學學習手冊)

  • IPython
  • NumPy
  • Pandas
  • Matplotlib
  • 機器學習

GitHub的Repo:https://github.com/jakevdp/PythonDataScienceHandbook

9.Mastering Python Data Visualization

  • 資料視覺化概論
  • 分析與繪圖
  • NumPy, SciPy, Matplotlib
  • 金融與統計模型
  • 統計學與機器學習
  • 生物資訊, 基因與神經網路模型

10.Python Data Science Cookbook

  • Python資料型態與結構
  • 常用資料分析模組
  • 資料探勘、機器學習

11.Mastering Python Data Analysis

  • 分類、分群、關聯、預測
  • 貝氏定理
  • 監督與非監督學習
  • 時間序列分析

12.Data Science from Scratch

  • 將統計學與資料科學用Python呈現出來
  • 比較像是入門書,沒有非常艱深的內容
  • 共有25個章節

GitHub的Repo:https://github.com/joelgrus/data-science-from-scratch

Written by

Machine Learning / Deep Learning / Python / Flutter cakeresume.com/yanwei-liu

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store