吹牛者提示您:看後求收藏(第1933章 卡片標準,臨高啟明,吹牛者,免費繁體小說),接著再看更方便。
請關閉瀏覽器的閱讀/暢讀/小說模式並且關閉廣告遮蔽過濾功能,避免出現內容無法顯示或者段落錯亂。
2毫米,短邊1.4毫米,誤差不超過0.05毫米。同一橫行上各程式碼孔的最小邊緣距離應大於0.51毫米,孔中心線與行列標準線誤差小於0.25毫米。”
會場一片安靜,與會者大概都在懷疑他們能否造出讀取和打孔這麼精密卡片的裝置來。而馮諾想的則是忘了把造紙廠的人請來參加討論,眼下能否造出合乎規格的紙來都十分難說,想爬個科技樹,步步都是坑啊,千頭萬緒。不過他早有準備,繼續說道:
“這是70年代末期國內釋出的穿孔卡片標準,其製造精度當然是為了滿足穿孔卡計算機系統當時每分鐘1000張到2000張卡片處理速度的要求來制訂的。我們手裡目前沒有穿孔卡計算機系統早期的卡片標準,不過可以肯定,20世紀初的技術達不到這樣的精度標準,實際上,一則50年代的資料中,穿孔卡的尺寸被簡單介紹為18.6厘米x8.3厘米。因此,適用於我們自制裝置的穿孔卡精度及誤差標準,還有待於在開發中進一步摸索。”
“穿孔卡的每一列可用來記錄一個字元,包括從0到9的數字和26個英文字母,以及若干種符號,如等號,百分號等。每列記錄一個字元,整個卡片共可以記錄80個字元。”
“字元透過打孔實現,某列如果要表達一個數字,直接在第0行到第9行的對應行穿孔。如果某列要表達一個英文字母,則需要高區和數字區同時打孔。通常頂端還會印製該列的取值作為參考,具體方案請大家翻到資料附錄2。”
穿孔卡片的每一列都能夠儲存1個英文字母,其方案為:
“三行區上打孔,搭配1-9數字行打孔,共有3x9=27中方案,除去0-1位置表示特殊符號‘斜線’,剛好能表示26個字母。有意思的是,之所以用0-1表示斜線,則是因為整個方案中,就只有這個編碼兩個孔的距離最近,技術實現難度較大。此外,其他的特殊符號則可以用每列穿3個孔的若干方案解決。霍勒裡思程式碼裡僅用了8號孔作為搭配的孔,但這同時也揭示了,3孔編碼在技術上是可能的。”
“之所以提到3孔編碼,是考慮到中文編碼的問題。”
這時會場出現了不少竊竊私語的聲音。中文的編碼是元老院應用穿孔卡的一大問題。當年穿孔卡計算機沒有在國內自行生產,用途也不廣泛,實際並無標準的中文編碼方法。
穿孔卡比起元老們熟知的資料儲存載體,容量實在小得可憐,每張18.7x8.3的卡片只能存80個字元,還只是英文字母。如果要是政府或者商務的業務處理也就罷了,大不了多用標準編號,比如幾年前司凱德和洪璜楠力推的國家標準程式碼體系,終於有了用武之地。
僅就眼下人口普查的需求來說,性別、籍貫、出生地、出生時間、現居所、文化水平、家庭成分等問題其實都可以很容易地透過編碼解決,過去18位身份證上面僅用了6位就表示了全國每個人的出生地。原因很簡單,命中每一個編碼的人都很多,編制編碼表是合適的。學過資料庫的人畫個ER圖就很容易發現本來就應該這麼做。但是唯有一個欄位,就是姓名,永遠也繞不過中文編碼的問題。人口普查表各欄位的具體設計工作可以丟給民生省的人,可是這中文編碼必須現在解決。
“其實中文編碼問題不難解決,問題是佔用空間太大。”
“1980年頒佈的《資訊交換用漢字編碼字符集》,通稱GB2312編碼,不僅僅規定了漢字在計算機上的表示方法,其實也定義了一套使用4位十進位制數字表示漢字的方法,就是區位碼。區位碼收錄了一級漢字3755個,二級漢字3008個,符號682個,基本滿足當前需求。所以最簡單的中文編碼方法就是每4列編碼一個漢字,大家以前高考的時候都塗過自己的姓名,當時用的就是
本章未完,點選下一頁繼續閱讀。