第一章是 setup python 環境,以及安裝 numpy, networkx。
作者是用 easy_install 來安裝,我個人會建議使用 virtualenv + pip 來安裝,一來是因為 virtualenv 可以方便的構建出測試環境,二來是因為 easy_install 在未來會以 pip 來替代。

指令:
  1. virtualenv mining_the_social_web
  2. cd mining_the_social_web && source bin/activate
  3. pip install numpy
  4. pip install networkx
  5. pip install twitter
  6. sudo apt-get install libyaml-dev
  7. pip install nltk
  8. pip install pygraphviz


照著第一個範例要去取得 trends 時,會發生錯誤,說 "The Twitter REST API v1 is no longer active. Please migrate to API v1.1."
新的 twitter API 的變動不少,v1 已經都淘汰,我試的結果是,現在必須都要經過 oauth 驗證以後才能使用 API。
Trend 現在也需要指定 WOEID 才能使用:

第二個是搜索關鍵字,但現在已經沒有 page 參數了(GET search/tweets),搜索關鍵字的範例:

NLTK 不支援中文,要中文斷詞的話,得花另外一番工夫,可以參考 LACC - NLTK中文化處理及文字筆畫音調剖析工具整合套件

結果看這本書所花的時間多半是在試範例上,Twitter API 改版為 1.1,必須都要驗證過才可以使用。作者在 github 上有開 repository 來放範例程式碼,也都有隨著更新,之前應該先上那邊去看的,可以省許多時間。

更多有關 Mining the Social Web 的事情

arrow
arrow

    elleryq 發表在 痞客邦 留言(0) 人氣()