10分鐘學會pandas的資料處理操作

在閱讀文章之前,先和各位讀者分享本文章的程式碼位置連結:

本文開始

相信大多數人都常常聽到「數據分析」這個名詞。

今天,我想用短短10分鐘的時間,教大家如何透過Python程式搭配別人已經開發好的的模組,進行快速的「數據分析」任務。

我們將透過pandas這個模組來進行數據分析。

如果讀者先前曾經安裝過Anaconda的話,本文會用到的程式和套件應該都在安裝時已經一起安裝好了。

並請讀者將CSV檔案下載到電腦的桌面(Desktop),以利本文的後續的進行

如果沒有安裝Anaconda的話,請跟著我透過以下步驟一起安裝所需套件

本文以Windows 10 64位元作業系統為例

首先,請先開啟Command Line介面(請點擊左下角的Windows圖示,輸入CMD,此時會跳出命令提示字元,點擊即可)

Image for post
Image for post

接著,我們進入到了一個黑色的畫面,別擔心,請將以下指令複製貼上,並按下Enter送出指令

Image for post
Image for post

請耐心等候安裝,它會將其他依賴的套件也跟著一起安裝

在等待安裝的過程中,和大家聊聊什麼是依賴的套件

我們電腦的程式不可能全部都自己獨立開發,在網路上有許多的人將程式寫好之後,公開在網路上,讓大家共同使用。這時候,我們就可以站在巨人的肩膀上,善用前人開發的程式,完成我們的需求,這時候我們稱這個前人開發的程式為「套件

依賴的套件,則是我們的程式為了完成特定的功能,引用前人開發的程式,作為我們程式的內部功能。

看到這裡,聰明的讀者應該就能了解依賴套件的意思了吧~

說到這裡,套件已經都安裝成功了吧~

開始來進行數據分析吧~

1.首先,啟動Jupyter Notebook

Image for post
Image for post

2.移動到Desktop桌面

Image for post
Image for post

3.根據以下圖片,點擊New

Image for post
Image for post

3.選擇Python3

Image for post
Image for post

我們的第一行程式:

按下Shift+Enter後,程式就會執行,並且跳到下一個窗格

Image for post
Image for post
如本圖所示,資料已經成功載入
Image for post
Image for post
顯示前10筆資料

嘗嘗pandas的其他功能~

補充:
Rows為行(由上到下)=0
Columns為列(左到右)=1

奇怪,顯示出來的圖片竟然出現亂碼,該怎麼解決呢?

請回到Notebook最頂端

將以下三行程式貼到Notebook中,接著再回到剛才的程式格,再Shift+Enter一次,亂碼問題就順利解決了

Image for post
Image for post

帶大家探索完pandas後,要告訴大家如何存檔

可以分別保存成CSV格式以及Excel常用的xlsx格式,就可以透過Excel開啟囉

如果想了解更多功能,可以參考之前寫的Python 資料處理筆記 — 使用Panda進行數據處理,裡面會有更詳細的介紹。

Written by

Machine Learning / Deep Learning / Python / Flutter cakeresume.com/yanwei-liu

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store