close
2.16 介紹 textwrap,就是一個很長很長的字串,然後想要整體寬度固定,就可以用這個模組。大致上的效果就像是在記事本裡輸入很長的字串,然後選「自動換行」的樣子。除了可以指定寬度外,也可以指定縮排。
2.17 處理 HTML/XML,HTML/XML 裡有些字是需要特別處理才能顯示出來的,例如 < > & ,Python 可以使用 html 模組裡的 escape() 將這些字轉成 &lt; &gt; &amp; (html 在 Python 3 裡才有)。 在 Python 2 裡,只能用 cgi 模組裡的 escape() 來達成。有特殊字元的話,則可以使用字串的 encode 函式,例如 s.encode('ascii', errors="xmlcharrefreplace")。轉回來在 Python 3 可以用 html.parser 的 HTMLParser.unescape() 來做,Python 2 裡則是 HTMLParser 模組。
2.18 用 re 做一個小的 token 切割器,這個還蠻神奇的,大致就有點像是 PLY 的前段工作,餵給 re 多個 pattern 編譯以後,在進行比對時,他會告知符合哪個 pattern ,那就可以接著做後續處理。
2.19 這個是接續 2.18 ,做 parser,結果是可以弄出 AST tree。我沒細看,之後要找時間仔細看這段。
2.20 在 byte string 上做處理,基本上用法跟一般字串的用法是一樣的。


參考資料:


arrow
arrow

    elleryq 發表在 痞客邦 留言(0) 人氣()