摘要:處理文本的最佳實踐是三明治要盡早把輸入例如讀取文件時的字節(jié)序列解碼成字符串。這種三明治中的肉片是程序的業(yè)務邏輯,在這里只能處理字符串對象。
處理文本的最佳實踐是“Unicode 三明治”
要盡早把輸入(例如讀取文件時)的字節(jié)序列解碼成字符串。
這種三明治中的“肉片”是程序的業(yè)務邏輯,在這里只能處理字符串對象。
在其他處理過程中,一定不能編碼或解碼。
對輸出來說,則要盡量晚地把字符串編碼成字節(jié)序列。
案例例如,在 Django 中,編碼建議 顯示指明編碼
視圖應該輸出 Unicode 字符串;
Django 會負責把響應編碼成字節(jié)序列,而且默認使用 UTF-8 編碼。
編碼默認值的最佳建議是:別依賴默認值
明確指定encodeing
除非想判斷編碼,否則不要在二進制模式中打開文本文件;
即便如此,也應該使用 Chardet,而不是重新發(fā)明輪子
盡早 字節(jié)序列解碼成字符串
三明治中的“肉片”是程序的業(yè)務邏輯,在這里只能處理字符串對象
盡量晚地把字符串編碼成字節(jié)序列
顯示編碼 別再二進制中打開文本,判斷編碼應該使用 Chardet文章版權歸作者所有,未經(jīng)允許請勿轉載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉載請注明本文地址:http://systransis.cn/yun/41649.html
摘要:可迭代的對象迭代器和生成器理念迭代是數(shù)據(jù)處理的基石??傻膶ο笈c迭代器的對比從可迭代的對象中獲取迭代器標準的迭代器接口有兩個方法。此外,也沒有辦法還原迭代器。最終,函數(shù)的定義體返回時,外層的生成器對象會拋出異常這一點與迭代器協(xié)議一致。 可迭代的對象、迭代器和生成器 理念 迭代是數(shù)據(jù)處理的基石。掃描內(nèi)存中放不下的數(shù)據(jù)集時,我們要找到一種惰性獲取數(shù)據(jù)項的方式,即按需一次獲取一個數(shù)據(jù)項。這...
摘要:第一章數(shù)據(jù)類型隱式方法利用快速生成類方法方法通過下標找元素自動支持切片操作可迭代方法與如果是一個自定義類的對象,那么會自己去調(diào)用其中由你實現(xiàn)的方法。若返回,則會返回否則返回。一個對象沒有函數(shù),解釋器會用作為替代。 第一章 python數(shù)據(jù)類型 1 隱式方法 利用collections.namedtuple 快速生成類 import collections Card = collec...
摘要:第一章數(shù)據(jù)類型隱式方法利用快速生成字典方法方法通過下標找元素自動支持切片操作可迭代方法與如果是一個自定義類的對象,那么會自己去調(diào)用其中由你實現(xiàn)的方法。若返回,則會返回否則返回。一個對象沒有函數(shù),解釋器會用作為替代。 第一章 python數(shù)據(jù)類型 1 隱式方法 利用collections.namedtuple 快速生成字典 import collections Card = coll...
摘要:繼承的優(yōu)缺點推出繼承的初衷是讓新手順利使用只有專家才能設計出來的框架。多重繼承的真實應用多重繼承能發(fā)揮積極作用。即便是單繼承,這個原則也能提升靈活性,因為子類化是一種緊耦合,而且較高的繼承樹容易倒。 繼承的優(yōu)缺點 推出繼承的初衷是讓新手順利使用只有專家才能設計出來的框架?!狝lan Kay 子類化內(nèi)置類型很麻煩 (如 list 或 dict)) ,別搞這種 直接子類化內(nèi)置類型(如 ...
摘要:小總結標準庫里的所有映射類型都是利用來實現(xiàn)只有可散列的數(shù)據(jù)類型才能用作這些映射里的鍵值不用字典推導用處理找不到的鍵找不到鍵返回某種默認值底層是與調(diào)用實現(xiàn)的字典插入更新原理其他大多數(shù)映射類型都提供了兩個很強大的方法和。 字典和集合 標準庫里的所有映射類型都是利用 dict 來實現(xiàn)的只有可散列的數(shù)據(jù)類型才能用作這些映射里的鍵(值不用) 可散列 一個對象是可散列的 它的散列值是不變的 對象...
閱讀 3093·2021-09-22 15:20
閱讀 2611·2019-08-30 15:54
閱讀 1975·2019-08-30 14:06
閱讀 3123·2019-08-30 13:05
閱讀 2467·2019-08-29 18:36
閱讀 581·2019-08-29 15:10
閱讀 533·2019-08-29 11:17
閱讀 833·2019-08-28 18:11