進階電腦系統理論與實作 (Fall 2020)
第 1 週 (Sep 8): 誠實面對自己
課程簡介和注意須知 / 課程簡介和作業解說錄影 *
每週均安排隨堂測驗,採計其中最高分的 8 次
學期評分方式: 隨堂測驗 (20%) + 個人作業+分組報告 (30%) + 自我評分 (50%)
在 Dcard 的課程問答
歷屆修課學生心得: 張家榮 , 陳品睿 , 蕭奕凱 , 方鈺學
分組報告示範: ARM-Linux
GNU/Linux 開發工具共筆 *
: 務必 自主 學習 Linux 操作, Git, HackMD, LaTeX 語法 (特別是數學式), GNU make, perf, gnuplot
透過 Computer Systems: A Programmer’s Perspective 學習系統軟體 *
: 本課程指定的教科書 (請及早購買: 天瓏書店 )
軟體缺失導致的危害
1970 年代推出的首款廣體民航客機波音 747 軟體由大約 40 萬行程式碼構成,而 2011 年引進的波音 787 的軟體規模則是波音 747 的 16 倍,約 650 萬行程式碼。換言之,你我的性命緊繫於一系列極為複雜的軟體系統之中,能不花點時間了解嗎?
軟體開發的安全性設計和測試驗證應獲得更高的重視
解讀計算機編碼
人們對數學的加減運算可輕易在腦中辨識符號並理解其結果,但電腦做任何事都受限於實體資料儲存及操作方式,換言之,電腦硬體實際只認得 0 和 1,卻不知道符號 + 和 - 在數學及應用場域的意義,於是工程人員引入「補數」以表達人們認知上的正負數
您有沒有想過,為何「二補數」(2’s complement) 被電腦廣泛採用呢?背後的設計考量是什麼?本文嘗試從數學觀點去解讀編碼背後的原理
linked list 和非連續記憶體操作 *
安排 linked list 作為第一份作業及隨堂測驗的考量點:
檢驗學員對於 C 語言指標操作的熟悉程度 (附帶思考:對於 Java 程式語言來說,該如何實作 linked list 呢?)
linked list 本質上就是對非連續記憶體的操作,乍看僅是一種單純的資料結構,但對應的演算法變化多端,像是「如何偵測 linked list 是否存在環狀結構?」和「如何對 linked list 排序並確保空間複雜度為 O(1) 呢?」
linked list 的操作,例如走訪 (traverse) 所有節點,反映出 Locality of reference (cache 用語) 的表現和記憶體階層架構 (memory hierarchy) 高度相關,學員很容易從實驗得知系統的行為,從而思考其衝擊和效能改進方案
無論是作業系統核心、C 語言函式庫內部、應用程式框架,到應用程式,都不難見到 linked list 的身影,包含多種針對效能和安全議題所做的 linked list 變形,又還要考慮到應用程式的泛用性 (generic programming),是很好的進階題材
題目 1 + 分析 *
題目2 (內含作答表單) / 參考題解1 , 參考題解2
作業 : 9 月 20 日截止繳交
第 1 週隨堂測驗: 題目 (內含作答表單)
課堂問答簡記
第 2 週 (Sep 15): C 語言程式設計
系統軟體開發思維
C 語言: 數值系統 *
儘管數值系統並非 C 語言所特有,但在 Linux 核心大量存在 u8/u16/u32/u64 這樣透過 typedef 所定義的型態,伴隨著各式 alignment 存取,若學員對數值系統的認知不夠充分,可能立即就被阻擋在探索 Linux 核心之外 —— 畢竟你完全搞不清楚,為何在 Linux 核心存取特定資料需要繞一大圈。
C 語言: Bitwise 操作 *
Linux 核心原始程式碼存在大量 bit(-wise) operations (簡稱 bitops),頗多乍看像是魔法的 C 程式碼就是 bitops 的組合。
類神經網路的 ReLU 及其常數時間複雜度實作
為什麼要深入學習 C 語言? *
C 語言發明者 Dennis M. Ritchie 說:「C 很彆扭又缺陷重重,卻異常成功。固然有歷史的巧合推波助瀾,可也的確是因為它能滿足於系統軟體實作的程式語言期待:既有相當的效率來取代組合語言,又可充分達到抽象且流暢,能用於描述在多樣環境的演算法。」
Linux 核心作為世界上最成功的開放原始碼計畫,也是 C 語言在工程領域的瑰寶,裡頭充斥各式「藝術」,往往會嚇到初次接觸的人們,但總是能夠用 C 語言標準和開發工具提供的擴展 (主要來自 gcc 的 GNU extensions) 來解釋。
基於 C 語言標準研究與系統程式安全議題
藉由研讀漏洞程式碼及 C 語言標準,討論系統程式的安全議題
透過除錯器追蹤程式碼實際運行的狀況,了解其運作原理;
取材自 dangling pointer, CWE-416 Use After Free, CVE-2017-16943 以及 integer overflow 的議題;
C 語言: bit-field
bit field 是 C 語言一個很被忽略的特徵,但在 Linux 和 gcc 這類系統軟體很常出現,不僅是精準規範每個 bit 的作用,甚至用來「擴充」C 語言
作業 : 9 月 27 日截止繳交
Week2 隨堂測驗: 題目 (內含作答表單)
第 3 週 (Sep 22): C 語言程式設計
公告
C 語言:記憶體管理、對齊及硬體特性 *
搭配閱讀: The Lost Art of Structure Packing
從虛擬記憶體談起,歸納出現代銀行和虛擬記憶體兩者高度相似: malloc 給出 valid pointer 不要太高興,等你要開始用的時候搞不好作業系統給個 OOM ——簡單來說就是一張支票,能不能拿來開等到兌現才知道。
探討 heap (動態配置產生,系統會存放在另外一塊空間)、data alignment,和 malloc 實作機制等議題。這些都是理解 Linux 核心運作的關鍵概念。
C 語言: 未定義行為 *
: C 語言最初為了開發 UNIX 和系統軟體而生,本質是低階的程式語言,在語言規範層級存在 undefined behavior,可允許編譯器引入更多最佳化
Greatest Common Divisor 特性和實作考量 : 探討最大公因數 (GCD) 特性,考慮微處理器架構實作帶來的效能衝擊。考慮到 binary GCD 及其最佳化。
C 語言: 前置處理器應用 *
C 語言之所以不需要時常發佈新的語言特徵又可以保持活力,前置處理器 (preprocessor) 是很重要的因素,有心者可逕行「擴充」C 語言
C 語言: 指標 *
應可體會為何走訪 linked list 節點的程式碼要這樣寫: struct list **lpp; for (lpp = &list; *lpp != NULL; lpp = &(*lpp)->next)
作業 : 10 月 7 日截止繳交
Week3 隨堂測驗: 題目 (內含作答表單)
第 4 週 (Sep 29): 浮點數 + code review
浮點數運算 *
: 工程領域往往是一系列的取捨結果,浮點數更是如此,在軟體發開發有太多失誤案例源自工程人員對浮點數運算的掌握不足,本議程希望藉由探討真實世界的血淋淋案例,帶著學員思考 IEEE 754 規格和相關軟硬體考量點,最後也會探討在深度學習領域為了改善資料處理效率,而引入的 BFloat16 這樣的新標準
CS:APP 第 2 章重點提示和練習 *
提升程式可讀性之實務技巧: (1) , (2) , (3)
作業 : 10 月 13 日截止繳交
Week4 隨堂測驗: 題目 (內含作答表單)
第 5 週 (Oct 6): Fixed-Point + Code Review + C 語言
第 6 週 (Oct 13): 編譯器和最佳化概念
第 7 週 (Oct 20): 效能最佳化、連結器,和執行階段函式庫
第 8 週 (Oct 27): ROS + Dynamic Programming + Code Review
第 9 週 (Nov 3): 微處理器 + Code Review
現代處理器設計:原理和關鍵特徵 *
Arm 處理器 *
: 系列講座導論, 架構和指令集, 基礎指令和開發環境, 虛擬化技術和應用
你可曾想過,就算選修了電機資訊相關科系大部份的課程,自己仍對每天用的手機,完全沒概念,是不是很沮喪呢?裡頭運作 ARM 處理器,但你知道裡面的 CPU pipeline 如何運作?裡頭的 cache 如何運作?四核心、八核心到底又如何運作?CPU 和 GPU 之間如何通訊?
系列講座預計涵蓋 ARMv7-A/M, ARMv8-A/M, virtualization extension, 以及對應的系統軟體技術,像是 big.LITTLE, hypervisor, 和 TEE 的概念介紹
Week9 隨堂測驗: 題目 (內含作答表單)
第 10 週 (Nov 10): 記憶體階層 + 虛擬記憶體
第 11 週 (Nov 17): 虛擬記憶體 + 系統呼叫
第 12 週 (Nov 24): 共享記憶體
第 13 週 (Dec 1): Linux 核心發展回顧
注意: 分組和課程專題 請在本日 17:10 前更新
Linux: 發展動態回顧 *
Making C Less Dangerous in the Linux Kernel / 錄影 *
Linux 核心中各式 C 語言程式設計的安全和正確議題
Variable Length Arrays are bad and slow
Explicit switch case fall-through
Always-initialized automatic variables
Arithmetic overflow detection
Hope for bounds checking
Control Flow Integrity: forward edges
Control Flow Integrity: backward edges
也提供了 gcc/clang 相關的編譯參數
解說1 , 解說2
Week13 隨堂測驗: 題目 (內含作答表單)
第 14 週 (Dec 8): 專題討論
第 15 週 (Dec 15): 電腦網路 / 專題討論
公告
分組和課程專題 已悉數更新,斟酌同學們的意願和過去開發的狀況
上述專題務必在 2021 年 1 月 19 日有明顯的更新 (人在做,GitHub/HackMD 在看,有空就趕快更新),當周審視後,就會進行期末評分
所有修課的學生應發訊息到授課教師的粉絲專頁 ,預約一對一討論 (專題執行和評分期待)
CS:APP 第 11 章: 電腦網路
Week15 隨堂測驗: 題目 (內含作答表單)
第 16 週 (Dec 22): 多核處理器架構
第 17 週 (Dec 29): Scalability + Regular expression
第 18 週 (Jan 5): 專案討論
Please enable JavaScript to view the comments powered by Disqus.