版本 202804d23892bb271f99eb5d56c62ff0f4789d66
Linux 核心設計
- Instructor: Jim Huang (黃敬群)
<jserv.tw@gmail.com>
- Facebook 粉絲專頁 (不要擔心提了笨問題,這專門用來和學生互動,可預約一對一討論)
- 課程信箱:
<embedded.master2015@gmail.com>
Linux 核心設計/實作 (Spring 2023) 課程進度表暨線上資源
- 第 1 週 (Feb 13, 14, 16): 誠實面對自己
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 課程簡介和注意須知 / 課程簡介解說錄影
*
- 每週均安排隨堂測驗,採計其中最高分的 9 次
- 學期評分方式: 隨堂測驗 (20%) + 個人作業+報告及專題 (30%) + 自我評分 (50%)
- 歷屆修課學生心得: 向景亘, 張家榮, 蕭奕凱, 方鈺學
- 分組報告示範: ARM-Linux, Xvisor
- GNU/Linux 開發工具共筆
*
: 務必 自主 學習 Linux 操作, Git, HackMD, LaTeX 語法 (特別是數學式), GNU make, perf, gnuplot- 確認 Ubuntu Linux 22.04-LTS (或更新的版本) 已順利安裝到你的電腦中
- 透過 Computer Systems: A Programmer’s Perspective 學習系統軟體
*
: 本課程指定的教科書 (請及早購買: 天瓏書店) - 軟體缺失導致的危害
- 1970 年代推出的首款廣體民航客機波音 747 軟體由大約 40 萬行程式碼構成,而 2011 年引進的波音 787 的軟體規模則是波音 747 的 16 倍,約 650 萬行程式碼。換言之,你我的性命緊繫於一系列極為複雜的軟體系統之中,能不花點時間了解嗎?
- 軟體開發的安全性設計和測試驗證應獲得更高的重視
- The adoption of Rust in Business (2022)
- 搭配觀看短片: Rust in 100 Seconds
- 解讀計算機編碼
- 人們對數學的加減運算可輕易在腦中辨識符號並理解其結果,但電腦做任何事都受限於實體資料儲存及操作方式,換言之,電腦硬體實際只認得 0 和 1,卻不知道符號 + 和 - 在數學及應用場域的意義,於是工程人員引入「補數」以表達人們認知上的正負數
- 您有沒有想過,為何「二補數」(2’s complement) 被電腦廣泛採用呢?背後的設計考量是什麼?本文嘗試從數學觀點去解讀編碼背後的原理
- 你所不知道的 C 語言:指標篇
*
- linked list 和非連續記憶體操作
*
- 安排 linked list 作為第一份作業及隨堂測驗的考量點:
- 檢驗學員對於 C 語言指標操作的熟悉程度 (附帶思考:對於 Java 程式語言來說,該如何實作 linked list 呢?)
- linked list 本質上就是對非連續記憶體的操作,乍看僅是一種單純的資料結構,但對應的演算法變化多端,像是「如何偵測 linked list 是否存在環狀結構?」和「如何對 linked list 排序並確保空間複雜度為 O(1) 呢?」
- linked list 的操作,例如走訪 (traverse) 所有節點,反映出 Locality of reference (cache 用語) 的表現和記憶體階層架構 (memory hierarchy) 高度相關,學員很容易從實驗得知系統的行為,從而思考其衝擊和效能改進方案
- 無論是作業系統核心、C 語言函式庫內部、應用程式框架,到應用程式,都不難見到 linked list 的身影,包含多種針對效能和安全議題所做的 linked list 變形,又還要考慮到應用程式的泛用性 (generic programming),是很好的進階題材
- 題目 1 + 分析
*
- 題目2 / 參考題解1, 參考題解2
- 題目3 / 參考題解
- 題目4 / 參考題解
- 題目5 / 參考題解
- 安排 linked list 作為第一份作業及隨堂測驗的考量點:
- 佳句偶得:「大部分的人一輩子洞察力不彰,原因之一是怕講錯被笑。想了一點點就不敢繼續也沒記錄或分享,時間都花在讀書查資料看別人怎麼想。看完就真的沒有自己的洞察了」(出處)
- 作業: 截止繳交日: Feb 28, 2023
- 第 1 週隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 2 週 (Feb 20, 21, 23): C 語言程式設計
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - Linux v6.2 發布: 接下來會是讓學員眼花撩亂的主版號/次版號的飛快跳躍 / kernel.org
- Linux: 作業系統術語及概念
*
- 系統軟體開發思維
- C 語言: 數值系統
*
- 儘管數值系統並非 C 語言所特有,但在 Linux 核心大量存在 u8/u16/u32/u64 這樣透過 typedef 所定義的型態,伴隨著各式 alignment 存取,若學員對數值系統的認知不夠充分,可能立即就被阻擋在探索 Linux 核心之外 —— 畢竟你完全搞不清楚,為何在 Linux 核心存取特定資料需要繞一大圈。
- C 語言: Bitwise 操作
*
- Linux 核心原始程式碼存在大量 bit(-wise) operations (簡稱 bitops),頗多乍看像是魔法的 C 程式碼就是 bitops 的組合
- 類神經網路的 ReLU 及其常數時間複雜度實作
- 從 √2 的存在談開平方根的快速運算
- Linux 核心的 hash table 實作
- 為什麼要深入學習 C 語言?
*
- C 語言發明者 Dennis M. Ritchie 說:「C 很彆扭又缺陷重重,卻異常成功。固然有歷史的巧合推波助瀾,可也的確是因為它能滿足於系統軟體實作的程式語言期待:既有相當的效率來取代組合語言,又可充分達到抽象且流暢,能用於描述在多樣環境的演算法。」
- Linux 核心作為世界上最成功的開放原始碼計畫,也是 C 語言在工程領域的瑰寶,裡頭充斥各式「藝術」,往往會嚇到初次接觸的人們,但總是能夠用 C 語言標準和開發工具提供的擴展 (主要來自 gcc 的 GNU extensions) 來解釋。
- 基於 C 語言標準研究與系統程式安全議題
- 藉由研讀漏洞程式碼及 C 語言標準,討論系統程式的安全議題
- 透過除錯器追蹤程式碼實際運行的狀況,了解其運作原理;
- 取材自 dangling pointer, CWE-416 Use After Free, CVE-2017-16943 以及 integer overflow 的議題;
- C 語言:記憶體管理、對齊及硬體特性
*
- 搭配閱讀: The Lost Art of Structure Packing
- 從虛擬記憶體談起,歸納出現代銀行和虛擬記憶體兩者高度相似: malloc 給出 valid pointer 不要太高興,等你要開始用的時候搞不好作業系統給個 OOM ——簡單來說就是一張支票,能不能拿來開等到兌現才知道。
- 探討 heap (動態配置產生,系統會存放在另外一塊空間)、data alignment,和 malloc 實作機制等議題。這些都是理解 Linux 核心運作的關鍵概念。
- C 語言: bit-field
- bit field 是 C 語言一個很被忽略的特徵,但在 Linux 和 gcc 這類系統軟體很常出現,不僅是精準規範每個 bit 的作用,甚至用來「擴充」C 語言
- 參考題目 / 參考題目
*
/ 參考題解 1, 參考題解 2, 參考題解 3 - 作業: 截止繳交日 Mar 7
- 第 2 週隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 3 週 (Feb 27, 28, Mar 2): 並行和 C 語言程式設計
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告
- 2 月 28 日沒有實體課程,但安排線上測驗 (「Linux 核心設計」課程的學員務必參加),在 15:20-23:59 之間依據 Google Calendar 進行作答
- 第二次作業已指派,可在 2 月 28 日晚間起開始繳交,截止繳交日 Mar 7
- 3 月 1 日晚間安排第一次作業的檢討直播 (事後有錄影),請參見 Google Calendar
- Linux: 發展動態回顧
*
- 從 Revolution OS 看作業系統生態變化
*
- 並行和多執行緒程式設計
*
: 應涵蓋 Part 1 到 Part 4 - C 語言: 函式呼叫
*
- 著重在計算機架構對應的支援和行為分析
- C 語言: 遞迴呼叫
*
- 或許跟你想像中不同,Linux 核心的原始程式碼裡頭也用到遞迴函式呼叫,特別在較複雜的實作,例如檔案系統,善用遞迴可大幅縮減程式碼,但這也導致追蹤程式運作的難度大增
- C 語言: 前置處理器應用
*
- C 語言之所以不需要時常發佈新的語言特徵又可以保持活力,前置處理器 (preprocessor) 是很重要的因素,有心者可逕行「擴充」C 語言
- C 語言: goto 和流程控制
*
- goto 在 C 語言被某些人看做是妖魔般的存在,不過實在不用這樣看待,至少在 Linux 核心原始程式碼中,goto 是大量存在 (跟你想像中不同吧)。有時不用 goto 會寫出更可怕的程式碼
- C 語言程式設計技巧
*
- 作業: 截止繳交日: Mar 21
- Week3 隨堂測驗: 題目 (內含作答表單)
- 教材解說
- 第 4 週 (Mar 6, 7, 9): 數值系統 + 編譯器
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- 請填寫 Google 表單,以利後續追蹤
- 《Demystifying the Linux CPU Scheduler》的書稿已寄送給成功大學的選課學生,旁聽的學員預計在 3 月 13 日取得 (第 5 週進度)
- 貢獻程式碼到 Linux 核心
- 追求神乎其技的程式設計之道
- 「可以看出抄襲風氣在台灣並不只是小時候在學校抄抄作業而已;媒體工作者在報導中任意抄襲及轉載是種不尊重自己專業的表現,不但隱含著一種應付了事的心態,更代表著這些人對於自己的工作沒有熱情,更沒有著一點堅持。如果要說我在美國看到這邊和台灣有什麼最大的不同,我想關鍵的差異就在對自己的工作有沒有熱情和堅持而已了。」
- 「程式藝術家也不過是在『簡潔』、『彈性』、『效率』這三大目標上進行一連串的取捨 (trade-off) 和最佳化。」
- Linux 核心的紅黑樹
- CS:APP 第 2 章重點提示和練習
*
- 核心開發者當然要熟悉編譯器行為
- C 編譯器原理和案例分析
*
- C 語言: 未定義行為
*
: C 語言最初為了開發 UNIX 和系統軟體而生,本質是低階的程式語言,在語言規範層級存在 undefined behavior,可允許編譯器引入更多最佳化 - C 語言: 編譯器和最佳化原理
*
- 《Demystifying the Linux CPU Scheduler》第 1 章
- 作業: 截止繳交日: Mar 30
- Week4 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 5 週 (Mar 13, 14, 16): Linux CPU scheduler
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- 本週導入客製化作業,讓學員選擇改進前四週的作業或自訂題目 (例如貢獻程式碼到 Linux 核心),隨後安排授課教師和學員的線上一對一討論
- 浮點數運算
*
: 工程領域往往是一系列的取捨結果,浮點數更是如此,在軟體發開發有太多失誤案例源自工程人員對浮點數運算的掌握不足,本議程希望藉由探討真實世界的血淋淋案例,帶著學員思考 IEEE 754 規格和相關軟硬體考量點,最後也會探討在深度學習領域為了改善資料處理效率,而引入的 BFloat16 這樣的新標準 - 記憶體配置器涉及 bitwise 操作及浮點數運算。傳統的即時系統和該領域的作業系統 (即 RTOS) 為了讓系統行為更可預測,往往捨棄動態記憶體配置的能力,但這顯然讓系統的擴充能力大幅受限。後來研究人員提出 TLSF (Two-Level Segregated Fit) 嘗試讓即時系統也能享用動態記憶體管理,其關鍵訴求是 “O(1) cost for malloc, free, realloc, aligned_alloc”
- Linux 核心模組運作原理
- Linux: 不只挑選任務的排程器
*
: 排程器 (scheduler) 是任何一個多工作業系統核心都具備的機制,但彼此落差極大,考量點不僅是演算法,還有當應用規模提昇時 (所謂的 scalability) 和涉及即時處理之際,會招致不可預知的狀況 (non-determinism),不僅即時系統在意,任何建構在 Linux 核心之上的大型服務都會深受衝擊。是此,Linux 核心的排程器經歷多次變革,需要留意的是,排程的難度不在於挑選下一個可執行的行程 (process),而是讓執行完的行程得以安插到合適的位置,使得 runqueue 依然依據符合預期的順序。 - C 語言: 動態連結器
*
- C 語言: 連結器和執行檔資訊
*
- C 語言: 執行階段程式庫 (CRT)
*
- 作業: 截止繳交 Apr 10
- Week5 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 6 週 (Mar 20, 21, 23): System call + CPU Scheduler
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告
- 自 3 月 22 日起,開放讓學員 (選課的學生 + 完成前二次作業過半要求的旁聽者) 跟授課教師預約一對一線上討論,請參照課程行事曆裡頭標注 “Office hour” 的時段,發訊息到 Facebook 粉絲專頁,簡述你的學習狀況並選定偏好的時段 (建議是 30 分鐘)。留意課程發送的公告信件
- 選修課程的學員在本學期至少要安排一次一對一討論,否則授課教師難以評估學習狀況,從而會影響評分,請重視自己的權益。
- coroutine
- Linux: 賦予應用程式生命的系統呼叫
- vDSO: 快速的 Linux 系統呼叫機制
- UNIX 作業系統 fork/exec 系統呼叫的前世今生
- 《Demystifying the Linux CPU Scheduler》
- 1.2.1 System calls
- 1.2.2 A different kind of software
- 1.2.3 User and kernel stacks
- 1.3 Process management
- 2.1 Introduction
- 2.2 Prior to CFS
- 2.3 Completely Fair Scheduler (CFS)
- 3.1 Structs and their role
- 作業: 截止繳交 Apr 17
- Week6 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 7 週 (Mar 27, 28, 30): Process, 並行和多執行緒
- 教材解說-1
*
, 教材解說-2*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- Linux: 不僅是個執行單元的 Process
*
: Linux 核心對於 UNIX Process 的實作相當複雜,不僅蘊含歷史意義 (幾乎每個欄位都值得講古),更是反映出資訊科技產業的變遷,核心程式碼的task_struct
結構體更是一絕,廣泛涵蓋 process 狀態、處理器、檔案系統、signal 處理、底層追蹤機制等等資訊,更甚者,還很曖昧地保存著 thread 的必要欄位,好似這兩者天生就脫不了干係- 探討 Linux 核心設計的特有思維,像是如何透過 LWP 和 NPTL 實作執行緒,又如何透過行程建立記憶體管理的一種抽象層,再者回顧行程間的 context switch 及排程機制,搭配 signal 處理
- 測試 Linux 核心的虛擬化環境
- 建構 User-Mode Linux 的實驗環境
*
- 〈Concurrency Primer〉導讀
- The C11 and C++11 Concurrency Model
- 並行和多執行緒程式設計
*
- CS:APP 第 12 章
- 課堂問答簡記
- 教材解說-1
- 第 8 週 (Apr 3, 4, 6): 並行程式設計, lock-free, Linux 同步機制
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- 4 月 4 日下午到晚間安排在家測驗,請在當日 15:00 刷新課程進度表/行事曆,以得知測驗方式
- 4 月 6 日晚間安排測驗
- 並行和多執行緒程式設計,涵蓋
- Atomics 操作
- POSIX Threads (請對照 CS:APP 第 12 章自行學習)
- Lock-free 程式設計
- 案例: Hazard pointer
- 案例: Ring buffer
- 案例: Thread Pool
- Linux: 淺談同步機制
*
- 利用 lkm 來變更特定 Linux 行程的內部狀態
- Week8 隨堂測驗: 題目 (內含作答表單)
- 教材解說
- 第 9 週 (Apr 10, 11, 13): futex, RCU, 伺服器開發與 Linux 核心對應的系統呼叫
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 第二次作業檢討
- 公告:
- 請於 4 月 14 日 10:00PM 刷新本頁面,以得知新指派的作業
- 4 月 13 日晚間安排課程測驗和作業解說,優先回覆學員在第 5 次作業的提問
- 由於其他課程的期中考陸續告一段落,本課程又要恢復之前的強度,請務必跟授課教師預約一對一討論,以進行相關調整
- Twitter 上面的笑話: index 的複數寫作 indices, complex 的複數寫作 complices, 那 mutex 的複數是什麼?答 “deadlock” – 出處
- A Deep dive into (implicit) Thread Local Storage
- 允許執行緒擁有私自的資料。對於每個執行緒來說,TLS 是獨一無二,不會相互影響。案例: 全域變數
errno
可能在多執行緒並行執行時錯誤,透過 TLS 處理errno
是個解決方案 __thread
, 在 POSIX Thread 稱為 thread-specific data,可見 pthread_key_create, pthread_setspecific- 在 x86/x86_64 Linux,fs segment 用以表示 TLS 的起始位置,讓執行緒知道該用的空間位於何處
- 允許執行緒擁有私自的資料。對於每個執行緒來說,TLS 是獨一無二,不會相互影響。案例: 全域變數
- 建立相容於 POSIX Thread 的實作
- RCU 同步機制
*
- Linux 核心設計: 針對事件驅動的 I/O 模型演化
*
- 精通數位邏輯對 coding 有什麼幫助?
- Linux: 透過 eBPF 觀察作業系統行為
*
: 動態追蹤技術(dynamic tracing)是現代軟體的進階除錯和追蹤機制,讓工程師以非常低的成本,在非常短的時間內,克服一些不是顯而易見的問題。它興起和繁榮的一個大背景是,我們正處在一個快速增長的網路互連異質運算環境,工程人員面臨著兩大方面的挑戰:- 規模:無論是使用者規模還是機房的規模、機器的數量都處於快速增長的時代;
- 複雜度:業務邏輯越來越複雜,運作的軟體也變得越來越複雜,我們知道它會分成很多很多層次,包括作業系統核心和其上各種系統軟體,像資料庫和網頁伺服器,再往上有腳本語言或者其他高階語言的虛擬機器或執行環境,更上面是應用層面的各種業務邏輯的抽象層次和很多複雜的程式邏輯。
- Week9 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 10 週 (Apr 17, 18, 20): 現代微處理器
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- 本週指派新作業: ktcp
*
- 選修「Linux 核心設計/實作」課程的研究生有額外的作業 (課程回顧和分享學習經驗給指導教授),詳情請留意後續信件
- 本週指派新作業: ktcp
- Cautionary Tales on Implementing the Software That People Want
*
- slides
- 1990: Queueing Problem: Stochastic Fair Queueing: Hash
- 2004: Real-Time Linux
- 2004: Dawn of Multicore Embedded
- Formal Verification is Heavily Used
- Natural Selection: Bugs are Software!
- People don’t know what they want. But for software developers, this is no excuse.
- 現代處理器設計:原理和關鍵特徵
*
- 《Demystifying the Linux CPU Scheduler》
- 2.4 Multiprocessing
- 3.2 Time keeping
- 3.4 Per-Entity Load Tracking
- 4.1 Group scheduling and cgroups: Introduction
- 4.2 Group scheduling and CPU bandwidth
- Linux: 中斷處理和現代架構考量
*
- Linux: 多核處理器和 spinlock
*
- CPU caches by Ulrich Drepper
- 進行中的繁體中文翻譯: 《每位程式開發者都該有的記憶體知識》
- 本文解釋用於現代電腦硬體的記憶體子系統的結構、闡述 CPU 快取發展的考量、它們如何運作,以及程式該如何針對記憶體操作調整,從而達到最佳的效能。
- 作業: 截止繳交 May 14
- 課堂問答簡記
- 教材解說
- 第 11 週 (Apr 24, 25, 20): 現代微處理器 + 記憶體管理
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告
- 學員應及早跟授課教師預約一對一線上討論,請參照課程行事曆裡頭標注 “Office hour” 的時段,發訊息到 Facebook 粉絲專頁,簡述你的學習狀況並選定偏好的時段 (建議是 30 分鐘)
- 課程規劃在 6 月下旬舉辦成果發表,時段調查
- 4 月 27 日晚間以 Google Meet 方式進行
- CS:APP 第 6 章重點提示
*
- CPU caches by Ulrich Drepper
- 進行中的繁體中文翻譯: 《每位程式開發者都該有的記憶體知識》
- 本文解釋用於現代電腦硬體的記憶體子系統的結構、闡述 CPU 快取發展的考量、它們如何運作,以及程式該如何針對記憶體操作調整,從而達到最佳的效能。
- CS:APP 第 9 章重點提示
*
- 解析 Linux 共享記憶體機制
- Linux 核心的 /dev/mem 裝置
- Week11 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 12 週 (May 1, 2, 4): 期末專題介紹和回顧
- 第 13 週 (May 8, 9, 11): 記憶體管理 + 裝置驅動程式
- 教材解說-1
*
, 教材解說-2*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - The Linux Virtual Memory System
- Linux: 記憶體管理
*
: 記憶體管理是 Linux 核心裡頭最複雜的部分,涉及到對計算機結構、slob/slab/slub 記憶體配置器、行程和執行檔樣貌、虛擬記憶體對應的例外處理、記憶體映射, UMA vs. NUMA 等等議題。 - POSIX Shared Memory: 在 Linux 中要實作出共享記憶體 (shared memory) 的機制很多,例如: 1) SysV shared memory; POSIX shared memory; 3) 以 mmap 對檔案進行記憶體映射; 4) 以 memfd_create() 實作跨越行程存取; 本文章探討 POSIX shared memory 的使用,並提供完整應用案例,最後探討相關的同步議題。
- C 語言: 物件導向程式設計
*
- Object-oriented design patterns in the kernel, part 1 / Object-oriented design patterns in the kernel, part 2
- 對照《Demystifying the Linux CPU Scheduler》
3.1 Structs and their role: sched class
- 對照《Demystifying the Linux CPU Scheduler》
- C 語言: Stream I/O, EOF 和例外處理
*
- CS:APP 第 10 章重點提示
*
- Linux: 裝置驅動程式介面和模型 / 錄影
*
by Greg Kroah-Hartman- 針對 Linux v5.x 的素材請見《The Linux Kernel Module Programming Guide》
- How to avoid writing device drivers for embedded Linux / 錄影
*
- Debugging Embedded Devices using GDB / 錄影
*
- Linux: Device Tree / 錄影
*
- Linux: Timer 及其管理機制
*
- Linux: Scalability 議題
*
- An Introduction to Cache-Oblivious Data Structures
- 「自動快取資料結構」,特性是無視硬體特定的快取大小,可能達到接近最優化快取的效能;
- 在現代 CPU 多層多種大小的快取架構下,它的理論宣稱其能自動優化在所有層的快取的存取效率。傳統上電腦科學做偏理論的人不重視實作的效能表現,而實作或硬體優化的從業人員往往不重視理論分析。這個學門卻是橫跨相當理論的演算法分析(需要相當多的進階數學工具),及相當低階的硬體效能理解;
- 影片: Memory Hierarchy Models
- Google Research 強者的心得: 關於變強這檔事(九), 設計高效 Hash Table (一), 設計高效 Hash Table (二)
- Skip List: 置放大量數字並進行排序的資料結構。不用樹狀結構,而改用高度不同的 List 來連接資料。資料結構在概念上可以表示成 Left Child-Right Sibling Binary Tree 的模式。是 Cache-oblivious Algorithm 的經典範例,時間複雜度與空間複雜度與 Binary Search Tree 皆相同,但精心調整的實作可超越 Binary Search Tree。
- Linux 核心: A kernel skiplist implementation (Part 1), Skiplists II: API and benchmarks
- Linux: linked list, Queues, Maps, Binary Trees: 錄影
*
/ 共筆 - C11 atomic variables and the kernel / Linux Documentation: Circular Buffers
- 教材解說-1
- 第 14 週 (May 15, 16, 18): 網路封包處理
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- 5 月 16 日恢復實體課程,討論期末專題
- 慶祝授課教師的論文被 OSDI 採納 (成功大學第一篇 OSDI 論文),授課教師請學員喝飲料
- 本週「已進行一對一討論」的學員會收到期末專題的確認信件,尚未預約討論的學員請及早進行
- Linux 核心網路
- semu: 精簡 RISC-V 系統模擬器: 支援 TAP/TUN 以存取電腦網路
- Build a virtual WiFi Driver for Linux
*
/ 錄影 - cserv is an event-driven and non-blocking web server.
- 展現 event-driven, non-blocking I/O Multiplexing (主要是 epoll), shared memory, processor affinity, coroutine, context switch, UNIX signal, dynamic linking, circular buffer, hash table, red-black tree, atomic operations 等議題的實際應用
- 可視為 seHTTPd 的後繼改進實作
- Memory Externalization With userfaultfd / 錄影
*
/ kernel documentation: userfaults - 課堂問答簡記
- 教材解說
- 第 15 週 (May 22, 23, 25): 網路封包處理 + 多核處理器架構
- 教材解說-1
*
, 教材解說-2*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告:
- 請學員及早進行 課程期末專題 並預約一對一討論
- How Linux Processes Your Network Packet / 錄影
*
- Kernel packet capture technologies / 錄影
*
- PACKET_MMAP
PACKET_MMAP
在核心空間內配置一塊核心緩衝區,一旦使用者層級的應用程式呼叫 mmap 將前述緩衝區映射到使用者層級時,接收到的 skb 會直接在該核心緩衝區,從而讓應用程式得以直接捕捉封包- 若沒有啟用
PACKET_MMAP
,就只能使用低效率的AF_PACKET
,不但有緩衝區空間的限制,而且每次捕捉封包就要一次系統呼叫。反之,PACKET_MMAP
多數時候不需要呼叫系統呼叫,也能實作出 zero-copy - 圖解 Linux tcpdump
- Multi-Core in Linux
*
- Multiprocessor OS
- 《Demystifying the Linux CPU Scheduler》
- 2.4 Multiprocessing
- 2.5 Energy-Aware Scheduling (EAS)
- 3.4 Per-Entity Load Tracking
- 4.2 Group scheduling and CPU bandwidth
- 4.3 Control Groups
- 4.4 Core scheduling
- 從 CPU cache coherence 談 Linux spinlock 可擴展能力議題
- Week15 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說-1
- 第 16 週 (May 29, Jun 1): 程式碼最佳化概念 + 多核處理器架構
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告
- 5 月 31 日下午,財團法人開放文化基金會 (OCF) 將在國立成功大學資訊工程系舉辦校園工作坊,主題是「開放原始碼 —— 打造護國神山的社會基礎建設」,談如何透過分享、討論和探索工程領域的秘技,利用科學與數學知識解決問題,發揮最強大的社會效益。
- 原訂 5 月 30 日下午的實體課程因應上述活動,暫停一次
- 及早更新 課程期末專題: 編輯「開發紀錄」頁面
- 補課: 6 月 19 日晚間及 6 月 20 日晚間 (線上直播)
- 期末成果發表: 6 月 24 日傍晚 (線上直播)
- 現代硬體架構上的演算法: 以 Binary Search 為例
- CS:APP 第 5 章重點提示和練習
*
- CS:APP Assign 5.18
*
- Linux: Scalability 議題
*
- atomic 和 memory order, memory barrier 的實作和效果
- Linux-Kernel Memory Ordering: Help Arrives At Last! / video
*
- Week16 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 教材解說
- 第 17 週 (Jun 10): 即時 Linux 的基礎建設
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告
- 佔學期總成績 50% 的自我評量,請在 6 月 24 日前完成。範例: User/OscarShiang
- 自我評量的網址必須符合
/User/你的GitHub帳號名稱
格式 (區分大小寫),請不要打錯字 - 自我評分項目 (都要有對應的超連結和延伸資訊)
- 成果發表: 與 Linux 核心相關的公開演講、貢獻到 Linux 核心和相關專案 (應標註對應的公開 commits/patches)
- 作業/隨堂測驗: 你的開發紀錄,人在做,Google 在看
- 期末專題: 開發紀錄,標注與授課教師「一對一討論」的時間,並列出你針對授課教師的問答、啟發及相關成果
- 所見所聞所感,包含授課教師編撰/翻譯的書籍 (《Demystifying the Linux CPU Scheduler》, 《Concurrency Primer》, 《Linux Kernel Module Programming Guide》, 〈每位程式開發者都該有的記憶體知識〉) 的讀後,務必提及閱讀〈因為自動飲料機而延畢的那一年〉和回顧自身在本課程的投入狀況
- 自我評量: 介於 1 到 10 之間的「整數」(不要自作主張寫
8.7
這樣的數值) 並要能充分反映上述評分項目
- Re: [問卦] 精通作業系統對Coding有什麼幫助?
- Linux: Timer 及其管理機制
- PREEMPT_RT 作為邁向硬即時作業系統的機制
- Linux 核心搶佔
- Towards PREEMPT_RT for the Full Task Isolation
- 教材解說
- 第 18 週 (Jun 12, 13): 即時 Linux 的基礎建設 + 多核處理器 + Rust
- 教材解說
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - 公告
- 6 月 13 日下午是本學期最後一次實體課程,以討論期末專題為主,歡迎大家出席,授課教師請喝飲料
- 及早進行期末專題
- 準備自我評量 (佔學期總分的 50%)
- Linux 核心搶佔
- Towards PREEMPT_RT for the Full Task Isolation
- Customize Real-Time Linux for Rocket Flight Control System
- RTMux: A Thin Multiplexer To Provide Hard Realtime Applications For Linux / EVL
- Memory Barrier
- Rust 程式語言
- 課堂問答簡記
- 教材解說
- 第 19 週 (Jun 18, 20): Rust, KVM
- 教材解說-1
*
(僅止於概況,請詳閱下方教材及個別的對應解說錄影) - COSCUP 2023 議程預覽
- Rust for Linux 研究
- 撰寫 LKMPG 的 Rust 核心模組
- Rust 程式語言
- Steve Klabnik 與 Carol Nichols,及 Rust 社群的協同撰寫的《The Rust Programming Language》線上書籍,由台灣的 Rust 社群提供繁體中文翻譯
- Rust by Example
- C vs. Rust
- Unsigned Integers Are Dangerous
- constant vs. immutable
- KVM: Linux 虛擬化基礎建設
- 教材解說-1
Linux 核心設計/實作 (Spring 2022) 課程進度表暨線上資源
- 第 1 週 (Feb 14, 15, 17): 誠實面對自己
- 課程簡介和注意須知 / 課程簡介解說錄影
*
- 每週均安排隨堂測驗,採計其中最高分的 8 次
- 學期評分方式: 隨堂測驗 (20%) + 個人作業+報告及專題 (30%) + 自我評分 (50%)
- 歷屆修課學生心得: 張家榮, 陳品睿, 蕭奕凱, 方鈺學
- 分組報告示範: ARM-Linux, Xvisor
- GNU/Linux 開發工具共筆
*
: 務必 自主 學習 Linux 操作, Git, HackMD, LaTeX 語法 (特別是數學式), GNU make, perf, gnuplot- 確認 Ubuntu Linux 20.04-LTS (或更新的版本) 已順利安裝到你的電腦中
- 透過 Computer Systems: A Programmer’s Perspective 學習系統軟體
*
: 本課程指定的教科書 (請及早購買: 天瓏書店) - 軟體缺失導致的危害
- 1970 年代推出的首款廣體民航客機波音 747 軟體由大約 40 萬行程式碼構成,而 2011 年引進的波音 787 的軟體規模則是波音 747 的 16 倍,約 650 萬行程式碼。換言之,你我的性命緊繫於一系列極為複雜的軟體系統之中,能不花點時間了解嗎?
- 軟體開發的安全性設計和測試驗證應獲得更高的重視
- 解讀計算機編碼
- 人們對數學的加減運算可輕易在腦中辨識符號並理解其結果,但電腦做任何事都受限於實體資料儲存及操作方式,換言之,電腦硬體實際只認得 0 和 1,卻不知道符號 + 和 - 在數學及應用場域的意義,於是工程人員引入「補數」以表達人們認知上的正負數
- 您有沒有想過,為何「二補數」(2’s complement) 被電腦廣泛採用呢?背後的設計考量是什麼?本文嘗試從數學觀點去解讀編碼背後的原理
- 你所不知道的 C 語言:指標篇
*
- linked list 和非連續記憶體操作
*
- 安排 linked list 作為第一份作業及隨堂測驗的考量點:
- 檢驗學員對於 C 語言指標操作的熟悉程度 (附帶思考:對於 Java 程式語言來說,該如何實作 linked list 呢?)
- linked list 本質上就是對非連續記憶體的操作,乍看僅是一種單純的資料結構,但對應的演算法變化多端,像是「如何偵測 linked list 是否存在環狀結構?」和「如何對 linked list 排序並確保空間複雜度為 O(1) 呢?」
- linked list 的操作,例如走訪 (traverse) 所有節點,反映出 Locality of reference (cache 用語) 的表現和記憶體階層架構 (memory hierarchy) 高度相關,學員很容易從實驗得知系統的行為,從而思考其衝擊和效能改進方案
- 無論是作業系統核心、C 語言函式庫內部、應用程式框架,到應用程式,都不難見到 linked list 的身影,包含多種針對效能和安全議題所做的 linked list 變形,又還要考慮到應用程式的泛用性 (generic programming),是很好的進階題材
- 題目 1 + 分析
*
- 題目2 / 參考題解1, 參考題解2
- 題目3 / 參考題解
- 題目4 / 參考題解
- 安排 linked list 作為第一份作業及隨堂測驗的考量點:
- 作業: 截止繳交日: Mar 1, 2022
- 第 1 週隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 課程簡介和注意須知 / 課程簡介解說錄影
- 第 2 週 (Feb 21, 22, 24): C 語言程式設計
- 課程基本資料表單: 務必填寫,以接收課程資訊
- Linux: 作業系統術語及概念
*
- 系統軟體開發思維
- C 語言: 數值系統
*
- 儘管數值系統並非 C 語言所特有,但在 Linux 核心大量存在 u8/u16/u32/u64 這樣透過 typedef 所定義的型態,伴隨著各式 alignment 存取,若學員對數值系統的認知不夠充分,可能立即就被阻擋在探索 Linux 核心之外 —— 畢竟你完全搞不清楚,為何在 Linux 核心存取特定資料需要繞一大圈。
- C 語言: Bitwise 操作
*
- Linux 核心原始程式碼存在大量 bit(-wise) operations (簡稱 bitops),頗多乍看像是魔法的 C 程式碼就是 bitops 的組合
- 類神經網路的 ReLU 及其常數時間複雜度實作
- 題目 / 參考題解
- 為什麼要深入學習 C 語言?
*
- C 語言發明者 Dennis M. Ritchie 說:「C 很彆扭又缺陷重重,卻異常成功。固然有歷史的巧合推波助瀾,可也的確是因為它能滿足於系統軟體實作的程式語言期待:既有相當的效率來取代組合語言,又可充分達到抽象且流暢,能用於描述在多樣環境的演算法。」
- Linux 核心作為世界上最成功的開放原始碼計畫,也是 C 語言在工程領域的瑰寶,裡頭充斥各式「藝術」,往往會嚇到初次接觸的人們,但總是能夠用 C 語言標準和開發工具提供的擴展 (主要來自 gcc 的 GNU extensions) 來解釋。
- 基於 C 語言標準研究與系統程式安全議題
- 藉由研讀漏洞程式碼及 C 語言標準,討論系統程式的安全議題
- 透過除錯器追蹤程式碼實際運行的狀況,了解其運作原理;
- 取材自 dangling pointer, CWE-416 Use After Free, CVE-2017-16943 以及 integer overflow 的議題;
- C 語言:記憶體管理、對齊及硬體特性
*
- 搭配閱讀: The Lost Art of Structure Packing
- 從虛擬記憶體談起,歸納出現代銀行和虛擬記憶體兩者高度相似: malloc 給出 valid pointer 不要太高興,等你要開始用的時候搞不好作業系統給個 OOM ——簡單來說就是一張支票,能不能拿來開等到兌現才知道。
- 探討 heap (動態配置產生,系統會存放在另外一塊空間)、data alignment,和 malloc 實作機制等議題。這些都是理解 Linux 核心運作的關鍵概念。
- C 語言: bit-field
- bit field 是 C 語言一個很被忽略的特徵,但在 Linux 和 gcc 這類系統軟體很常出現,不僅是精準規範每個 bit 的作用,甚至用來「擴充」C 語言
- 參考題目
*
/ 參考題解 1, 參考題解 2, 參考題解 3 - 作業: 截止繳交日 Mar 13, 2022
- 第 2 週隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 3 週 (Feb 28, Mar 1, 3): 並行和 C 語言程式設計
- Linux: 發展動態回顧
*
- 並行和多執行緒程式設計
*
: 應涵蓋 Part 1 到 Part 4 - C 語言: 函式呼叫
*
- 著重在計算機架構對應的支援和行為分析
- C 語言: 遞迴呼叫
*
- 或許跟你想像中不同,Linux 核心的原始程式碼裡頭也用到遞迴函式呼叫,特別在較複雜的實作,例如檔案系統,善用遞迴可大幅縮減程式碼,但這也導致追蹤程式運作的難度大增
- C 語言: 前置處理器應用
*
- C 語言之所以不需要時常發佈新的語言特徵又可以保持活力,前置處理器 (preprocessor) 是很重要的因素,有心者可逕行「擴充」C 語言
- C 語言: goto 和流程控制
*
- goto 在 C 語言被某些人看做是妖魔般的存在,不過實在不用這樣看待,至少在 Linux 核心原始程式碼中,goto 是大量存在 (跟你想像中不同吧)。有時不用 goto 會寫出更可怕的程式碼
- C 語言程式設計技巧
*
- 作業: 截止繳交日: Mar 21, 2022
- Week3 隨堂測驗: 題目 (內含作答表單)
- Linux: 發展動態回顧
- 第 4 週 (Mar 7, 8, 10): 浮點數 + 編譯器和連結器
- 公告: 請填寫 Google 表單,以利後續追蹤
- 追求神乎其技的程式設計之道
- CS:APP 第 2 章重點提示和練習
*
- 浮點數運算
*
: 工程領域往往是一系列的取捨結果,浮點數更是如此,在軟體發開發有太多失誤案例源自工程人員對浮點數運算的掌握不足,本議程希望藉由探討真實世界的血淋淋案例,帶著學員思考 IEEE 754 規格和相關軟硬體考量點,最後也會探討在深度學習領域為了改善資料處理效率,而引入的 BFloat16 這樣的新標準 - 核心開發者當然要熟悉編譯器行為
這段程式碼在 gcc 開啟/關閉編譯器最佳化,會有截然不同的返回值 (
-O0
編譯會得到1
;-O1
或更高等級編譯會得到0
),為何?C 語言標準並未定義像 a, b 在記憶體中的配置,因此比較其記憶體位置屬於未定義行為,當最佳化未開啟時,GCC 不檢查程式行為是否符合 C 規範,才會去比較其內容,而在最佳化啟動後,推論這樣的未定義行為而略去記憶體操作。 - C 編譯器原理和案例分析
*
- C 語言: 未定義行為
*
: C 語言最初為了開發 UNIX 和系統軟體而生,本質是低階的程式語言,在語言規範層級存在 undefined behavior,可允許編譯器引入更多最佳化 - C 語言: 編譯器和最佳化原理
*
- C 語言: 動態連結器
*
- C 語言: 連結器和執行檔資訊
*
- C 語言: 執行階段程式庫 (CRT)
*
- 作業: 截止繳交日: Mar 28, 2022
- Week4 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 5 週 (Mar 14, 15, 17): Linux Process
- 從 √2 的運算談浮點數
- Linux 核心模組運作原理
- Linux: 不僅是個執行單元的 Process
*
: Linux 核心對於 UNIX Process 的實作相當複雜,不僅蘊含歷史意義 (幾乎每個欄位都值得講古),更是反映出資訊科技產業的變遷,核心程式碼的task_struct
結構體更是一絕,廣泛涵蓋 process 狀態、處理器、檔案系統、signal 處理、底層追蹤機制等等資訊,更甚者,還很曖昧地保存著 thread 的必要欄位,好似這兩者天生就脫不了干係- 探討 Linux 核心設計的特有思維,像是如何透過 LWP 和 NPTL 實作執行緒,又如何透過行程建立記憶體管理的一種抽象層,再者回顧行程間的 context switch 及排程機制,搭配 signal 處理
- UNIX 作業系統 fork/exec 系統呼叫的前世今生
- Linux: 不只挑選任務的排程器
*
: 排程器 (scheduler) 是任何一個多工作業系統核心都具備的機制,但彼此落差極大,考量點不僅是演算法,還有當應用規模提昇時 (所謂的 scalability) 和涉及即時處理之際,會招致不可預知的狀況 (non-determinism),不僅即時系統在意,任何建構在 Linux 核心之上的大型服務都會深受衝擊。是此,Linux 核心的排程器經歷多次變革,需要留意的是,排程的難度不在於挑選下一個可執行的行程 (process),而是讓執行完的行程得以安插到合適的位置,使得 runqueue 依然依據符合預期的順序。 - 作業: 截止繳交 Apr 25
- Week5 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 6 週 (Mar 21, 22, 24): Linux Process + Scheduler
- 公告
- 本週開放讓學員 (選課的學生 + 完成前二次作業過半要求的旁聽者) 跟授課教師預約一對一線上討論,請參照課程行事曆裡頭標注 “Office hour” 的時段,發訊息到 Facebook 粉絲專頁,簡述你的學習狀況並選定偏好的時段 (建議是 30 分鐘)
- 選課修課程的學員在本學期至少要安排一次一對一討論,否則授課教師難以評估學習狀況,從而會影響評分,請重視自己的權益。
- 建構 User-Mode Linux 的實驗環境
*
- Linux: 不只挑選任務的排程器
*
: 排程器 (scheduler) 是任何一個多工作業系統核心都具備的機制,但彼此落差極大,考量點不僅是演算法,還有當應用規模提昇時 (所謂的 scalability) 和涉及即時處理之際,會招致不可預知的狀況 (non-determinism),不僅即時系統在意,任何建構在 Linux 核心之上的大型服務都會深受衝擊。是此,Linux 核心的排程器經歷多次變革,需要留意的是,排程的難度不在於挑選下一個可執行的行程 (process),而是讓執行完的行程得以安插到合適的位置,使得 runqueue 依然依據符合預期的順序。 - 作業: 截止繳交 Apr 25
- Week6 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 公告
- 第 7 週 (Mar 28, 29, 31): 並行和多執行緒
- 公告
- 學員應及早跟授課教師預約一對一線上討論,請參照課程行事曆裡頭標注 “Office hour” 的時段,發訊息到 Facebook 粉絲專頁,簡述你的學習狀況並選定偏好的時段 (建議是 30 分鐘)
- 除了進行師生互動,一對一線上討論時段將重新調整學員的作業內容及規劃,請選課學員務必留意
- 依據成功大學行事曆,4 月 4 日和 5 日放假,但本課程仍安排學員在家進行線上測驗,請留意信件通知
- 本週不安排隨堂測驗
- CPU Schedulers for Linux Kernel
- 並行和多執行緒程式設計
*
: 應涵蓋 Part 5 到 Part 7 - CS:APP 第 12 章
- Linux: 淺談同步機制
*
- 課堂問答簡記
- 公告
- 第 8 週 (Apr 4, 5, 7): 測驗 + 作業檢討
- 第 9 週 (Apr 11, 12, 14): 伺服器開發與 Linux 核心對應的系統呼叫
- Linux 核心設計: 針對事件驅動的 I/O 模型演化
*
- 精通數位邏輯對 coding 有什麼幫助?
- Linux: 透過 eBPF 觀察作業系統行為
*
: 動態追蹤技術(dynamic tracing)是現代軟體的進階除錯和追蹤機制,讓工程師以非常低的成本,在非常短的時間內,克服一些不是顯而易見的問題。它興起和繁榮的一個大背景是,我們正處在一個快速增長的網路互連異質運算環境,工程人員面臨著兩大方面的挑戰:- 規模:無論是使用者規模還是機房的規模、機器的數量都處於快速增長的時代;
- 複雜度:業務邏輯越來越複雜,運作的軟體也變得越來越複雜,我們知道它會分成很多很多層次,包括作業系統核心和其上各種系統軟體,像資料庫和網頁伺服器,再往上有腳本語言或者其他高階語言的虛擬機器或執行環境,更上面是應用層面的各種業務邏輯的抽象層次和很多複雜的程式邏輯。
- Week9 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- Linux 核心設計: 針對事件驅動的 I/O 模型演化
- 第 10 週 (Apr 18, 19, 21): 現代微處理器
- Twitter 上面的笑話: index 的複數寫作 indices, complex 的複數寫作 complices, 那 mutex 的複數是什麼?答 “deadlock” – 出處
- 現代處理器設計:原理和關鍵特徵
*
- Linux: 中斷處理和現代架構考量
*
- Linux: 多核處理器和 spinlock
*
- CPU caches by Ulrich Drepper
- 進行中的繁體中文翻譯: 《每位程式開發者都該知道的記憶體知識》
- 本文解釋用於現代電腦硬體的記憶體子系統的結構、闡述 CPU 快取發展的考量、它們如何運作,以及程式該如何針對記憶體操作調整,從而達到最佳的效能。
- CS:APP 第 6 章重點提示
*
- CS:APP 第 9 章重點提示
*
- Week10 隨堂測驗: 題目 (內含作答表單)
- 作業: 截止繳交 May 10
- 課堂問答簡記
- 第 11 週 (Apr 25, 26, 28): 現代微處理器 + 記憶體管理
- 公告
- 第 6 次作業 已指派
- 學員應及早跟授課教師預約一對一線上討論,請參照課程行事曆裡頭標注 “Office hour” 的時段,發訊息到 Facebook 粉絲專頁,簡述你的學習狀況並選定偏好的時段 (建議是 30 分鐘)
- CPU caches by Ulrich Drepper
- 進行中的繁體中文翻譯: 《每位程式開發者都該知道的記憶體知識》
- 本文解釋用於現代電腦硬體的記憶體子系統的結構、闡述 CPU 快取發展的考量、它們如何運作,以及程式該如何針對記憶體操作調整,從而達到最佳的效能。
- 解析 Linux 共享記憶體機制
- Linux: 賦予應用程式生命的系統呼叫
*
- Linux: 記憶體管理
*
: 記憶體管理是 Linux 核心裡頭最複雜的部分,涉及到對計算機結構、slob/slab/slub 記憶體配置器、行程和執行檔樣貌、虛擬記憶體對應的例外處理、記憶體映射, UMA vs. NUMA 等等議題。 - Linux 核心的 /dev/mem 裝置
- Week11 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 公告
- 第 12 週 (May 2, 3, 5): 共享記憶體 + 裝置驅動程式
- 公告
- POSIX Shared Memory: 在 Linux 中要實作出共享記憶體 (shared memory) 的機制很多,例如: 1) SysV shared memory; POSIX shared memory; 3) 以 mmap 對檔案進行記憶體映射; 4) 以 memfd_create() 實作跨越行程存取; 本文章探討 POSIX shared memory 的使用,並提供完整應用案例,最後探討相關的同步議題。
- C 語言: 物件導向程式設計
*
- Object-oriented design patterns in the kernel, part 1 / Object-oriented design patterns in the kernel, part 2
- C 語言: Stream I/O, EOF 和例外處理
*
- CS:APP 第 10 章重點提示
*
- Linux: 裝置驅動程式介面和模型 / 錄影
*
by Greg Kroah-Hartman- 針對 Linux v5.x 的素材請見《The Linux Kernel Module Programming Guide》
- How to avoid writing device drivers for embedded Linux / 錄影
*
- Linux: Device Tree / 錄影
*
- vcam 是個針對 Linux 核心開發的虛擬攝影機裝置,全部程式碼僅 1 千 5 百行,從而可理解 V4L2 (video fro Linux APIs, version 2) 的使用和 Linux 多媒體架構。開發一個虛擬的攝影機裝置除了理解 Linux 核心設計外,也有資訊安全的幫助,例如你可以安插相關程式碼,紀錄有哪些應用程式偷偷啟動攝影機,但過程中又不會揭露真正的隱私。
- vwifi 是個程式碼約 500 行,真的可運作的 WiFi 裝置驅動程式,採用 cfg80211 框架,在 Linux v5.4 和 Linux v5.14 都測試過,支援 scan, connect, disconnect 等 cfg80211 的介面操作,且允許封包轉向 Linux 核心網路堆疊
- Week12 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 13 週 (May 9, 10, 12): Scalability + 同步機制
- 以下教材的解說錄影
*
- Linux: Timer 及其管理機制
*
- Linux: Scalability 議題
*
- An Introduction to Cache-Oblivious Data Structures
- 「自動快取資料結構」,特性是無視硬體特定的快取大小,可能達到接近最優化快取的效能;
- 在現代 CPU 多層多種大小的快取架構下,它的理論宣稱其能自動優化在所有層的快取的存取效率。傳統上電腦科學做偏理論的人不重視實作的效能表現,而實作或硬體優化的從業人員往往不重視理論分析。這個學門卻是橫跨相當理論的演算法分析(需要相當多的進階數學工具),及相當低階的硬體效能理解;
- 影片: Memory Hierarchy Models
- Google Research 強者的心得: 關於變強這檔事(九), 設計高效 Hash Table (一), 設計高效 Hash Table (二)
- Skip List: 置放大量數字並進行排序的資料結構。不用樹狀結構,而改用高度不同的 List 來連接資料。資料結構在概念上可以表示成 Left Child-Right Sibling Binary Tree 的模式。是 Cache-oblivious Algorithm 的經典範例,時間複雜度與空間複雜度與 Binary Search Tree 皆相同,但精心調整的實作可超越 Binary Search Tree。
- Linux 核心: A kernel skiplist implementation (Part 1), Skiplists II: API and benchmarks
- Linux: linked list, Queues, Maps, Binary Trees: 錄影
*
/ 共筆 - Linux: RCU 同步機制
*
- C11 atomic variables and the kernel / Linux Documentation: Circular Buffers
- Week13 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 以下教材的解說錄影
- 第 14 週 (May 16, 17, 19): 網路封包處理
- 公告:
- 2022 年 Linux 核心設計/實作課程期末專題列表受理學員經由授課教師討論後,予以更新和進行
- 以下教材的解說錄影
*
- 討論區回顧
- Linux 核心網路
- cserv is an event-driven and non-blocking web server.
- 展現 event-driven, non-blocking I/O Multiplexing (主要是 epoll), shared memory, processor affinity, coroutine, context switch, UNIX signal, dynamic linking, circular buffer, hash table, red-black tree, atomic operations 等議題的實際應用
- 可視為 seHTTPd 的後繼改進實作
- Memory Externalization With userfaultfd / 錄影
*
/ kernel documentation: userfaults - How Linux Processes Your Network Packet / 錄影
*
- Kernel packet capture technologies / 錄影
*
- PACKET_MMAP
PACKET_MMAP
在核心空間內配置一塊核心緩衝區,一旦使用者層級的應用程式呼叫 mmap 將前述緩衝區映射到使用者層級時,接收到的 skb 會直接在該核心緩衝區,從而讓應用程式得以直接捕捉封包- 若沒有啟用
PACKET_MMAP
,就只能使用低效率的AF_PACKET
,不但有緩衝區空間的限制,而且每次捕捉封包就要一次系統呼叫。反之,PACKET_MMAP
多數時候不需要呼叫系統呼叫,也能實作出 zero-copy - 圖解 Linux tcpdump
- Week14 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 公告:
- 第 15 週 (May 23, 24, 26): 多核處理器架構 + Linux 同步處理機制 + 程式碼最佳化概念
- 公告:
- 請學員及早進行 課程期末專題 並預約一對一討論
- 以下教材的解說錄影
*
- Multi-Core in Linux
*
- Multicore Caches / Cache Coherence
*
/ video - 並行程式設計: Lock-Free Programming
*
- A Deep dive into (implicit) Thread Local Storage
- 允許執行緒擁有私自的資料。對於每個執行緒來說,TLS 是獨一無二,不會相互影響。案例: 全域變數
errno
可能在多執行緒並行執行時錯誤,透過 TLS 處理errno
是個解決方案 __thread
, 在 POSIX Thread 稱為 thread-specific data,可見 pthread_key_create, pthread_setspecific- 在 x86/x86_64 Linux,fs segment 用以表示 TLS 的起始位置,讓執行緒知道該用的空間位於何處
- 允許執行緒擁有私自的資料。對於每個執行緒來說,TLS 是獨一無二,不會相互影響。案例: 全域變數
- RCU 同步機制
*
- CS:APP 第 5 章重點提示和練習
*
- CS:APP Assign 5.18
*
- 專案賞析
- threaded-logger: 向 Linux 核心的 lockless printk 致敬
- 在 glibc 的實作中,就算是 puts 這樣貌似單純的實作,也要有 lock
- 123elf / 解釋
- threaded-logger: 向 Linux 核心的 lockless printk 致敬
- Week15 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 公告:
- 第 16 週 (May 30, 21, Jun 3): 多核處理器架構
- 第 17 週 (Jun 6, 7, 9): 即時 Linux 的基礎建設
- 公告
- 佔學期總成績 50% 的自我評量,請在 6 月 30 日前完成。範例: User/OscarShiang
- 自我評量的網址必須符合
/User/你的GitHub帳號名稱
格式 (區分大小寫),請不要打錯字 - 自我評分項目 (都要有對應的超連結和延伸資訊)
- 成果發表: 與 Linux 核心相關的公開演講
- Linux 核心和相關專案貢獻: 貢獻到 Linux 核心和相關專案
- 作業/隨堂測驗: 你的開發紀錄,人在做,Google 在看
- 期末專題: 開發紀錄,標注與授課教師「一對一討論」的時間,並列出你的啟發及成果
- 所見所聞所感,包含授課教師編撰/翻譯的書籍 (《Demystifying the Linux CPU Scheduler》, 《Concurrency Primer》, 《Linux Kernel Module Programming Guide》, 〈每位程式開發者都該有的記憶體知識〉) 的讀後
- 自我評量: 介於 1 到 10 之間的整數 (不要自作主張寫
8.7
這樣的數值)
- 以下教材的解說錄影
*
- Re: [問卦] 精通作業系統對Coding有什麼幫助?
- Linux: Timer 及其管理機制
- PREEMPT_RT 作為邁向硬即時作業系統的機制
- Linux 核心搶佔
- 公告
- 第 18 週 (Jun 13, 14, 16): 多核處理器, Rust
- 課程討論區回顧
- Rust 程式語言
- 現況: 已被 Google Android 團隊選為開發系統軟體的另一個程式語言,與 C 和 C++ 並列; 自 2017 年 Facebook 內部採納 Rust 程式語言的專案增加,像是加密貨幣 Diem (前身為 Libra) 就將 Rust 作為主要程式語言並對外發布,
- Steve Klabnik 與 Carol Nichols,及 Rust 社群的協同撰寫的《The Rust Programming Language》線上書籍,由台灣的 Rust 社群提供繁體中文翻譯
- Rust by Example
- C vs. Rust
- Linux 核心採納 Rust 的狀況
- Memory Barrier
- Week18 隨堂測驗: 題目 (內含作答表單)
Linux 核心設計 (Spring 2021) 課程進度表暨線上資源
- 第 1 週 (Feb 23): 誠實面對自己
- 課程簡介和注意須知 / 課程簡介解說錄影
*
- 每週均安排隨堂測驗,採計其中最高分的 8 次
- 學期評分方式: 隨堂測驗 (20%) + 個人作業+報告及專題 (30%) + 自我評分 (50%)
- 歷屆修課學生心得: 張家榮, 陳品睿, 蕭奕凱, 方鈺學
- 分組報告示範: ARM-Linux, Xvisor
- GNU/Linux 開發工具共筆
*
: 務必 自主 學習 Linux 操作, Git, HackMD, LaTeX 語法 (特別是數學式), GNU make, perf, gnuplot- 確認 Ubuntu Linux 20.04-LTS (或更新的版本) 已順利安裝到你的電腦中
- 透過 Computer Systems: A Programmer’s Perspective 學習系統軟體
*
: 本課程指定的教科書 (請及早購買: 天瓏書店) - 軟體缺失導致的危害
- 1970 年代推出的首款廣體民航客機波音 747 軟體由大約 40 萬行程式碼構成,而 2011 年引進的波音 787 的軟體規模則是波音 747 的 16 倍,約 650 萬行程式碼。換言之,你我的性命緊繫於一系列極為複雜的軟體系統之中,能不花點時間了解嗎?
- 軟體開發的安全性設計和測試驗證應獲得更高的重視
- 解讀計算機編碼
- 人們對數學的加減運算可輕易在腦中辨識符號並理解其結果,但電腦做任何事都受限於實體資料儲存及操作方式,換言之,電腦硬體實際只認得 0 和 1,卻不知道符號 + 和 - 在數學及應用場域的意義,於是工程人員引入「補數」以表達人們認知上的正負數
- 您有沒有想過,為何「二補數」(2’s complement) 被電腦廣泛採用呢?背後的設計考量是什麼?本文嘗試從數學觀點去解讀編碼背後的原理
- 你所不知道的 C 語言:指標篇
*
- linked list 和非連續記憶體操作
*
- 安排 linked list 作為第一份作業及隨堂測驗的考量點:
- 檢驗學員對於 C 語言指標操作的熟悉程度 (附帶思考:對於 Java 程式語言來說,該如何實作 linked list 呢?)
- linked list 本質上就是對非連續記憶體的操作,乍看僅是一種單純的資料結構,但對應的演算法變化多端,像是「如何偵測 linked list 是否存在環狀結構?」和「如何對 linked list 排序並確保空間複雜度為 O(1) 呢?」
- linked list 的操作,例如走訪 (traverse) 所有節點,反映出 Locality of reference (cache 用語) 的表現和記憶體階層架構 (memory hierarchy) 高度相關,學員很容易從實驗得知系統的行為,從而思考其衝擊和效能改進方案
- 無論是作業系統核心、C 語言函式庫內部、應用程式框架,到應用程式,都不難見到 linked list 的身影,包含多種針對效能和安全議題所做的 linked list 變形,又還要考慮到應用程式的泛用性 (generic programming),是很好的進階題材
- 題目 1 + 分析
*
- 題目2 / 參考題解1, 參考題解2
- 題目3 / 參考題解
- 安排 linked list 作為第一份作業及隨堂測驗的考量點:
- 作業: 3 月 7 日截止繳交
- 第 1 週隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 課程簡介和注意須知 / 課程簡介解說錄影
- 第 2 週 (Mar 2): C 語言程式設計
- 課程基本資料表單: 務必填寫,以接收課程資訊
- Linux: 作業系統術語及概念
*
- 系統軟體開發思維
- C 語言: 數值系統
*
- 儘管數值系統並非 C 語言所特有,但在 Linux 核心大量存在 u8/u16/u32/u64 這樣透過 typedef 所定義的型態,伴隨著各式 alignment 存取,若學員對數值系統的認知不夠充分,可能立即就被阻擋在探索 Linux 核心之外 —— 畢竟你完全搞不清楚,為何在 Linux 核心存取特定資料需要繞一大圈。
- C 語言: Bitwise 操作
*
- Linux 核心原始程式碼存在大量 bit(-wise) operations (簡稱 bitops),頗多乍看像是魔法的 C 程式碼就是 bitops 的組合
- 類神經網路的 ReLU 及其常數時間複雜度實作
- 題目 / 參考題解
- 為什麼要深入學習 C 語言?
*
- C 語言發明者 Dennis M. Ritchie 說:「C 很彆扭又缺陷重重,卻異常成功。固然有歷史的巧合推波助瀾,可也的確是因為它能滿足於系統軟體實作的程式語言期待:既有相當的效率來取代組合語言,又可充分達到抽象且流暢,能用於描述在多樣環境的演算法。」
- Linux 核心作為世界上最成功的開放原始碼計畫,也是 C 語言在工程領域的瑰寶,裡頭充斥各式「藝術」,往往會嚇到初次接觸的人們,但總是能夠用 C 語言標準和開發工具提供的擴展 (主要來自 gcc 的 GNU extensions) 來解釋。
- 基於 C 語言標準研究與系統程式安全議題
- 藉由研讀漏洞程式碼及 C 語言標準,討論系統程式的安全議題
- 透過除錯器追蹤程式碼實際運行的狀況,了解其運作原理;
- 取材自 dangling pointer, CWE-416 Use After Free, CVE-2017-16943 以及 integer overflow 的議題;
- C 語言:記憶體管理、對齊及硬體特性
*
- 搭配閱讀: The Lost Art of Structure Packing
- 從虛擬記憶體談起,歸納出現代銀行和虛擬記憶體兩者高度相似: malloc 給出 valid pointer 不要太高興,等你要開始用的時候搞不好作業系統給個 OOM ——簡單來說就是一張支票,能不能拿來開等到兌現才知道。
- 探討 heap (動態配置產生,系統會存放在另外一塊空間)、data alignment,和 malloc 實作機制等議題。這些都是理解 Linux 核心運作的關鍵概念。
- C 語言: bit-field
- bit field 是 C 語言一個很被忽略的特徵,但在 Linux 和 gcc 這類系統軟體很常出現,不僅是精準規範每個 bit 的作用,甚至用來「擴充」C 語言
- 作業: 3 月 15 日截止繳交
- 第 2 週隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 3 週 (Mar 9): 並行和 C 語言程式設計
- 並行和多執行緒程式設計
*
: 應涵蓋 Part 1 到 Part 4 - C 語言: 函式呼叫
*
- 著重在計算機架構對應的支援和行為分析
- C 語言: 遞迴呼叫
*
- 或許跟你想像中不同,Linux 核心的原始程式碼裡頭也用到遞迴函式呼叫,特別在較複雜的實作,例如檔案系統,善用遞迴可大幅縮減程式碼,但這也導致追蹤程式運作的難度大增
- C 語言: 前置處理器應用
*
- C 語言之所以不需要時常發佈新的語言特徵又可以保持活力,前置處理器 (preprocessor) 是很重要的因素,有心者可逕行「擴充」C 語言
- C 語言: goto 和流程控制
*
- goto 在 C 語言被某些人看做是妖魔般的存在,不過實在不用這樣看待,至少在 Linux 核心原始程式碼中,goto 是大量存在 (跟你想像中不同吧)。有時不用 goto 會寫出更可怕的程式碼
- C 語言程式設計技巧
*
- 作業: 3 月 22 日截止繳交
- Week3 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 並行和多執行緒程式設計
- 第 4 週 (Mar 16): 浮點數 + 編譯器和連結器
- CS:APP 第 2 章重點提示和練習
*
- 浮點數運算
*
: 工程領域往往是一系列的取捨結果,浮點數更是如此,在軟體發開發有太多失誤案例源自工程人員對浮點數運算的掌握不足,本議程希望藉由探討真實世界的血淋淋案例,帶著學員思考 IEEE 754 規格和相關軟硬體考量點,最後也會探討在深度學習領域為了改善資料處理效率,而引入的 BFloat16 這樣的新標準 - 核心開發者當然要熟悉編譯器行為
這段程式碼在 gcc 開啟/關閉編譯器最佳化,會有截然不同的返回值 (
-O0
編譯會得到0
;-O1
或更高等級編譯會得到1
),為何?C 語言標準並未定義像 a, b 在記憶體中的配置,因此比較其記憶體位置屬於未定義行為,當最佳化未開啟時,GCC 不檢查程式行為是否符合 C 規範,才會去比較其內容,而在最佳化啟動後,推論這樣的未定義行為而略去記憶體操作。 - C 編譯器原理和案例分析
*
- C 語言: 未定義行為
*
: C 語言最初為了開發 UNIX 和系統軟體而生,本質是低階的程式語言,在語言規範層級存在 undefined behavior,可允許編譯器引入更多最佳化 - C 語言: 編譯器和最佳化原理
*
- C 語言: 動態連結器
*
- C 語言: 連結器和執行檔資訊
*
- C 語言: 執行階段程式庫 (CRT)
*
- 作業: 4 月 5 日截止繳交
- Week4 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- CS:APP 第 2 章重點提示和練習
- 第 5 週 (Mar 23): Linux Process
- 建構 User-Mode Linux 的實驗環境
*
- Linux: 不僅是個執行單元的 Process
*
: Linux 核心對於 UNIX Process 的實作相當複雜,不僅蘊含歷史意義 (幾乎每個欄位都值得講古),更是反映出資訊科技產業的變遷,核心程式碼的task_struct
結構體更是一絕,廣泛涵蓋 process 狀態、處理器、檔案系統、signal 處理、底層追蹤機制等等資訊,更甚者,還很曖昧地保存著 thread 的必要欄位,好似這兩者天生就脫不了干係- 探討 Linux 核心設計的特有思維,像是如何透過 LWP 和 NPTL 實作執行緒,又如何透過行程建立記憶體管理的一種抽象層,再者回顧行程間的 context switch 及排程機制,搭配 signal 處理
- UNIX 作業系統 fork/exec 系統呼叫的前世今生
- Linux: 不只挑選任務的排程器
*
: 排程器 (scheduler) 是任何一個多工作業系統核心都具備的機制,但彼此落差極大,考量點不僅是演算法,還有當應用規模提昇時 (所謂的 scalability) 和涉及即時處理之際,會招致不可預知的狀況 (non-determinism),不僅即時系統在意,任何建構在 Linux 核心之上的大型服務都會深受衝擊。是此,Linux 核心的排程器經歷多次變革,需要留意的是,排程的難度不在於挑選下一個可執行的行程 (process),而是讓執行完的行程得以安插到合適的位置,使得 runqueue 依然依據符合預期的順序。 - 作業: 4 月 12 日截止繳交
- Week5 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 建構 User-Mode Linux 的實驗環境
- 第 6 週 (Mar 30): Linux Process
- Linux: 不只挑選任務的排程器
*
: 排程器 (scheduler) 是任何一個多工作業系統核心都具備的機制,但彼此落差極大,考量點不僅是演算法,還有當應用規模提昇時 (所謂的 scalability) 和涉及即時處理之際,會招致不可預知的狀況 (non-determinism),不僅即時系統在意,任何建構在 Linux 核心之上的大型服務都會深受衝擊。是此,Linux 核心的排程器經歷多次變革,需要留意的是,排程的難度不在於挑選下一個可執行的行程 (process),而是讓執行完的行程得以安插到合適的位置,使得 runqueue 依然依據符合預期的順序。 - 作業: 4 月 20 日截止繳交
- quiz6
- Week6 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- Linux: 不只挑選任務的排程器
- 第 7 週 (Apr 6): 並行和多執行緒
- 並行和多執行緒程式設計
*
: 應涵蓋 Part 5 到 Part 7 - Linux: 透過 eBPF 觀察作業系統行為
*
: 動態追蹤技術(dynamic tracing)是現代軟體的進階除錯和追蹤機制,讓工程師以非常低的成本,在非常短的時間內,克服一些不是顯而易見的問題。它興起和繁榮的一個大背景是,我們正處在一個快速增長的網路互連異質運算環境,工程人員面臨著兩大方面的挑戰:- 規模:無論是使用者規模還是機房的規模、機器的數量都處於快速增長的時代;
- 複雜度:業務邏輯越來越複雜,運作的軟體也變得越來越複雜,我們知道它會分成很多很多層次,包括作業系統核心和其上各種系統軟體,像資料庫和網頁伺服器,再往上有腳本語言或者其他高階語言的虛擬機器或執行環境,更上面是應用層面的各種業務邏輯的抽象層次和很多複雜的程式邏輯。
- CS:APP 第 12 章
- 高效 Web 伺服器開發
- Linux: 淺談同步機制
*
- Week7 隨堂測驗: 題目 (內含作答表單)
- 並行和多執行緒程式設計
- 第 8 週 (Apr 13): 處理器架構和 Web 伺服器開發
- 近期 Facebook 討論區回顧
- 高效 Web 伺服器開發
- in-kernel HTTP server
*
- 現代處理器設計:原理和關鍵特徵
*
- Linux: 中斷處理和現代架構考量
*
- Linux: 多核處理器和 spinlock
*
- Linux: Timer 及其管理機制
*
- Linux: Scalability 議題
*
- 練習題
- Week8 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 9 週 (Apr 20): 作業和隨堂測驗回顧
- 第 10 週 (Apr 27): 記憶體管理
- 公告: Linux 核心設計課程期末專題
- 回顧討論區
- CS:APP 第 6 章重點提示
*
- CPU caches by Ulrich Drepper
- CS:APP 第 9 章重點提示
*
- Week10 隨堂測驗: 題目 (內含作答表單)
- 課堂問答簡記
- 第 11 週 (May 4): timerfd + 資料結構
- 透過 timerfd 處理週期性任務
- An Introduction to Cache-Oblivious Data Structures
- 「自動快取資料結構」,特性是無視硬體特定的快取大小,可能達到接近最優化快取的效能;
- 在現代 CPU 多層多種大小的快取架構下,它的理論宣稱其能自動優化在所有層的快取的存取效率。傳統上電腦科學做偏理論的人不重視實作的效能表現,而實作或硬體優化的從業人員往往不重視理論分析。這個學門卻是橫跨相當理論的演算法分析(需要相當多的進階數學工具),及相當低階的硬體效能理解;
- 影片: Memory Hierarchy Models
- Google Research 強者的心得: 關於變強這檔事(九)
- Skip List: 置放大量數字並進行排序的資料結構。不用樹狀結構,而改用高度不同的 List 來連接資料。資料結構在概念上可以表示成 Left Child-Right Sibling Binary Tree 的模式。是 Cache-oblivious Algorithm 的經典範例,時間複雜度與空間複雜度與 Binary Search Tree 皆相同,但是實際運作效率比 Binary Search Tree 還要好。
- Linux 核心: A kernel skiplist implementation (Part 1), Skiplists II: API and benchmarks
- Linux: linked list, Queues, Maps, Binary Trees: 錄影
*
/ 共筆 - Week11 隨堂測驗: 題目 (內含作答表單)
- 第 12 週 (May 11): 共享記憶體 + 物件導向程式設計 + I/O
- POSIX Shared Memory: 在 Linux 中要實作出共享記憶體 (shared memory) 的機制很多,例如: 1) SysV shared memory; POSIX shared memory; 3) 以 mmap 對檔案進行記憶體映射; 4) 以 memfd_create() 實作跨越行程存取; 本文章探討 POSIX shared memory 的使用,並提供完整應用案例,最後探討相關的同步議題。
- 解析 Linux 共享記憶體機制
- Linux: 賦予應用程式生命的系統呼叫
*
- Linux: 記憶體管理
*
: 記憶體管理是 Linux 核心裡頭最複雜的部分,涉及到對計算機結構、slob/slab/slub 記憶體配置器、行程和執行檔樣貌、虛擬記憶體對應的例外處理、記憶體映射, UMA vs. NUMA 等等議題。 - Linux 核心的 /dev/mem 裝置
- 以 sendfile 和 splice 系統呼叫達到 Zero-Copy
- C 語言: 物件導向程式設計
*
- Object-oriented design patterns in the kernel, part 1 / Object-oriented design patterns in the kernel, part 2
- C 語言: Stream I/O, EOF 和例外處理
*
- CS:APP 第 10 章重點提示
*
- Week12 隨堂測驗: 題目 (內含作答表單)
- 第 13 週 (May 18): 同步機制 + 裝置驅動程式模型
- 第 14 週 (May 25): Linux 核心發展回顧 + 網路封包處理
- 討論區回顧
- cserv is an event-driven and non-blocking web server.
- 展現 event-driven, non-blocking I/O Multiplexing (主要是 epoll), shared memory, processor affinity, coroutine, context switch, UNIX signal, dynamic linking, circular buffer, hash table, red-black tree, atomic operations 等議題的實際應用
- 可視為 seHTTPd 的後繼改進實作
- Linux: 發展動態回顧
*
- Memory Externalization With userfaultfd / 錄影
*
/ kernel documentation: userfaults - How Linux Processes Your Network Packet / 錄影
*
- Kernel packet capture technologies / 錄影
*
- PACKET_MMAP
PACKET_MMAP
在核心空間內配置一塊核心緩衝區,一旦使用者層級的應用程式呼叫 mmap 將前述緩衝區映射到使用者層級時,接收到的 skb 會直接在該核心緩衝區,從而讓應用程式得以直接捕捉封包- 若沒有啟用
PACKET_MMAP
,就只能使用低效率的AF_PACKET
,不但有緩衝區空間的限制,而且每次捕捉封包就要一次系統呼叫。反之,PACKET_MMAP
多數時候不需要呼叫系統呼叫,也能實作出 zero-copy - 圖解 Linux tcpdump
- Week14 隨堂測驗: 題目 (內含作答表單)
- 第 15 週 (Jun 1): 多核處理器架構 + Linux 同步處理機制 + 程式碼最佳化概念
- 公告:
- 請學員及早進行 課程期末專題 並預約一對一討論
- 預計 6 月 30 日 15:00,授課教師會繳交學期成績,在這之前都有補救空間
- Multi-Core in Linux
*
- Multicore Caches / Cache Coherence
*
/ video - 並行程式設計: Lock-Free Programming
*
- A Deep dive into (implicit) Thread Local Storage
- 允許執行緒擁有私自的資料。對於每個執行緒來說,TLS 是獨一無二,不會相互影響。案例: 全域變數
errno
可能在多執行緒並行執行時錯誤,透過 TLS 處理errno
是個解決方案 __thread
, 在 POSIX Thread 稱為 thread-specific data,可見 pthread_key_create, pthread_setspecific- 在 x86/x86_64 Linux,fs segment 用以表示 TLS 的起始位置,讓執行緒知道該用的空間位於何處
- 允許執行緒擁有私自的資料。對於每個執行緒來說,TLS 是獨一無二,不會相互影響。案例: 全域變數
- RCU 同步機制
*
- CS:APP 第 5 章重點提示和練習
*
- CS:APP Assign 5.18
*
- Week15 隨堂測驗: 題目 (內含作答表單)
- 公告:
- 第 16 週 (Jun 8): 多核處理器架構
- A tour of the ARM architecture and its Linux support
*
- Multiprocessor OS
- How Reliable Are Modern CPUs?
*
- 近年 Google 與 Facebook 注意到 CPU 會在不同的情況下不預期地計算出錯誤的結果,在一些資料中心上出錯的頻率明顯增加。研究人員認為這並非架構設計的步驟錯誤,這些問題也並沒有在生產時的測試中被偵測出來。
- 隨堂測驗回顧:
- Week16 隨堂測驗: 題目 (內含作答表單)
- A tour of the ARM architecture and its Linux support
- 第 17 週 (Jun 15): 多處理器架構
- Multiprocessor OS
- Linux-Kernel Memory Ordering: Help Arrives At Last! / video
*
- atomic 和 memory order, memory barrier 的實作和效果
- 隨堂測驗回顧:
- Week17 隨堂測驗: 題目 (內含作答表單)
- 第 18 週 (Jun 22): 多核處理器, 時鐘管理, Real-time
- 隨堂測驗回顧:
- Rust 程式語言
- 現況: 已被 Google Android 團隊選為開發系統軟體的另一個程式語言,與 C 和 C++ 並列; 自 2017 年 Facebook 內部採納 Rust 程式語言的專案增加,像是加密貨幣 Diem (前身為 Libra) 就將 Rust 作為主要程式語言並對外發布,
- Steve Klabnik 與 Carol Nichols,及 Rust 社群的協同撰寫的《The Rust Programming Language》線上書籍,由台灣的 Rust 社群提供繁體中文翻譯
- Rust by Example
- C vs. Rust
- Linux 核心採納 Rust 的狀況
- Linux: Scalability 議題
*
- Linux: Timer 及其管理機制
- Memory Barrier
- Week18 隨堂測驗: 題目 (內含作答表單)
Linux 核心設計 (Spring 2020) 課程進度表暨線上資源
- 第 1 週 (Feb 18): 誠實面對自己
- 課程簡介和注意須知 / 課程簡介和作業解說錄影
*
- 每週均安排隨堂測驗,採計其中最高分的 8 次
- 學期評分方式: 隨堂測驗 (25%) + 個人作業 (25%) + 分組報告及專題 (25%) + 自我評分 (25%)
- 歷屆修課學生心得: 張家榮, 陳品睿, 蕭奕凱, 方鈺學
- 分組報告示範: ARM-Linux, Xvisor
- Linux 核心設計 (線上講座)
*
- GNU/Linux 開發工具共筆
*
: 務必 自主 學習 Linux 操作, Git, HackMD, LaTeX 語法 (特別是數學式), GNU make, perf, gnuplot - 透過 Computer Systems: A Programmer’s Perspective 學習系統軟體
*
: 本課程指定的教科書 (請及早購買: 天瓏書店) - 軟體缺失導致的危害
- 1970 年代推出的首款廣體民航客機波音 747 軟體由大約 40 萬行程式碼構成,而 2011 年引進的波音 787 的軟體規模則是波音 747 的 16 倍,約 650 萬行程式碼。換言之,你我的性命緊繫於一系列極為複雜的軟體系統之中,能不花點時間了解嗎?
- 軟體開發的安全性設計和測試驗證應獲得更高的重視
- 解讀計算機編碼
- 人們對數學的加減運算可輕易在腦中辨識符號並理解其結果,但電腦做任何事都受限於實體資料儲存及操作方式,換言之,電腦硬體實際只認得 0 和 1,卻不知道符號 + 和 - 在數學及應用場域的意義,於是工程人員引入「補數」以表達人們認知上的正負數
- 您有沒有想過,為何「二補數」(2’s complement) 被電腦廣泛採用呢?背後的設計考量是什麼?本文嘗試從數學觀點去解讀編碼背後的原理
- linked list 和非連續記憶體操作
*
/ linked list 題目分析*
- 作業: 3 月 21 日截止繳交
- 第 1 週隨堂測驗: 題目 (內含作答表單) (此次不計分,熱身用) / 參考題解1, 參考題解2
- 課程簡介和注意須知 / 課程簡介和作業解說錄影
- 第 2 週 (Feb 25): C 語言程式設計
- 系統軟體開發思維
- C 語言: 數值系統
*
- 儘管數值系統並非 C 語言所特有,但在 Linux 核心大量存在 u8/u16/u32/u64 這樣透過 typedef 所定義的型態,伴隨著各式 alignment 存取,若學員對數值系統的認知不夠充分,可能立即就被阻擋在探索 Linux 核心之外 —— 畢竟你完全搞不清楚,為何在 Linux 核心存取特定資料需要繞一大圈。
- C 語言: Bitwise 操作
*
- Linux 核心原始程式碼存在大量 bit(-wise) operations (簡稱 bitops),頗多乍看像是魔法的 C 程式碼就是 bitops 的組合。
- 為什麼要深入學習 C 語言?
*
- C 語言發明者 Dennis M. Ritchie 說:「C 很彆扭又缺陷重重,卻異常成功。固然有歷史的巧合推波助瀾,可也的確是因為它能滿足於系統軟體實作的程式語言期待:既有相當的效率來取代組合語言,又可充分達到抽象且流暢,能用於描述在多樣環境的演算法。」
- Linux 核心作為世界上最成功的開放原始碼計畫,也是 C 語言在工程領域的瑰寶,裡頭充斥各式「藝術」,往往會嚇到初次接觸的人們,但總是能夠用 C 語言標準和開發工具提供的擴展 (主要來自 gcc 的 GNU extensions) 來解釋。
- 基於 C 語言標準研究與系統程式安全議題
- 藉由研讀漏洞程式碼及 C 語言標準,討論系統程式的安全議題
- 透過除錯器追蹤程式碼實際運行的狀況,了解其運作原理;
- 取材自 dangling pointer, CWE-416 Use After Free, CVE-2017-16943 以及 integer overflow 的議題;
- C 語言:記憶體管理、對齊及硬體特性
*
- 搭配閱讀: The Lost Art of Structure Packing
- 從虛擬記憶體談起,歸納出現代銀行和虛擬記憶體兩者高度相似: malloc 給出 valid pointer 不要太高興,等你要開始用的時候搞不好作業系統給個 OOM ——簡單來說就是一張支票,能不能拿來開等到兌現才知道。
- 探討 heap (動態配置產生,系統會存放在另外一塊空間)、data alignment,和 malloc 實作機制等議題。這些都是理解 Linux 核心運作的關鍵概念。
- C 語言: bit-field
- bit field 是 C 語言一個很被忽略的特徵,但在 Linux 和 gcc 這類系統軟體很常出現,不僅是精準規範每個 bit 的作用,甚至用來「擴充」C 語言
- Week2 隨堂測驗: 題目 (內含作答表單) (此次不計分,熱身用)
- 第 3 週 (Mar 3): C 語言程式設計
- Linux: 作業系統術語及概念
*
- C 語言: 指標
*
- 應可體會為何走訪 linked list 節點的程式碼要這樣寫:
struct list **lpp; for (lpp = &list; *lpp != NULL; lpp = &(*lpp)->next)
- 應可體會為何走訪 linked list 節點的程式碼要這樣寫:
- C 語言: 函式呼叫
*
- 著重在計算機架構對應的支援和行為分析
- C 語言: 遞迴呼叫
*
- 或許跟你想像中不同,Linux 核心的原始程式碼裡頭也用到遞迴函式呼叫,特別在較複雜的實作,例如檔案系統,善用遞迴可大幅縮減程式碼,但這也導致追蹤程式運作的難度大增
- C 語言: 前置處理器應用
*
- C 語言之所以不需要時常發佈新的語言特徵又可以保持活力,前置處理器 (preprocessor) 是很重要的因素,有心者可逕行「擴充」C 語言
- C 語言: goto 和流程控制
*
- goto 在 C 語言被某些人看做是妖魔般的存在,不過實在不用這樣看待,至少在 Linux 核心原始程式碼中,goto 是大量存在 (跟你想像中不同吧)。有時不用 goto 會寫出更可怕的程式碼
- C 語言程式設計技巧
*
- 作業: 3 月 21 日截止繳交,作業份量相當可觀,務必及早開始
- Week3 隨堂測驗: 題目 (內含作答表單), 參考題解
- 課程基本資料表單: 務必填寫,以接收課程資訊
- Linux: 作業系統術語及概念
- 第 4 週 (Mar 10): 浮點數 + 編譯器和連結器
- 浮點數運算: 工程領域往往是一系列的取捨結果,浮點數更是如此,在軟體發開發有太多失誤案例源自工程人員對浮點數運算的掌握不足,本議程希望藉由探討真實世界的血淋淋案例,帶著學員思考 IEEE 754 規格和相關軟硬體考量點,最後也會探討在深度學習領域為了改善資料處理效率,而引入的 BFloat16 這樣的新標準
- 核心開發者當然要熟悉編譯器行為
這段程式碼在 gcc 開啟/關閉編譯器最佳化,會有截然不同的返回值 (
-O0
編譯會得到0
;-O1
或更高等級編譯會得到1
),為何?C 語言標準並未定義像 a, b 在記憶體中的配置,因此比較其記憶體位置屬於未定義行為,當最佳化未開啟時,GCC 不檢查程式行為是否符合 C 規範,才會去比較其內容,而在最佳化啟動後,推論這樣的未定義行為而略去記憶體操作。 - C 編譯器原理和案例分析
*
- C 語言: 未定義行為
*
: C 語言最初為了開發 UNIX 和系統軟體而生,本質是低階的程式語言,在語言規範層級存在 undefined behavior,可允許編譯器引入更多最佳化 - C 語言: 編譯器和最佳化原理
*
- C 語言: 動態連結器
*
- C 語言: 連結器和執行檔資訊
*
- C 語言: 執行階段程式庫 (CRT)
*
- Linux-based RTOS Experimental Platform for Constructing Self-driving Vehicles
- 作業: 3 月 28 日截止繳交
- Week4 隨堂測驗: 題目 (內含作答表單)
- 第 5 週 (Mar 17): 作業回顧 + code review
- 第 6 週 (Mar 24): Linux Process
- 針對 Homework2 的 Code Review 解說
*
- Linux: 透過 eBPF 觀察作業系統行為
*
: 動態追蹤技術(dynamic tracing)是現代軟體的進階除錯和追蹤機制,讓工程師以非常低的成本,在非常短的時間內,克服一些不是顯而易見的問題。它興起和繁榮的一個大背景是,我們正處在一個快速增長的網路互連異質運算環境,工程人員面臨著兩大方面的挑戰:- 規模:無論是使用者規模還是機房的規模、機器的數量都處於快速增長的時代;
- 複雜度:業務邏輯越來越複雜,運作的軟體也變得越來越複雜,我們知道它會分成很多很多層次,包括作業系統核心和其上各種系統軟體,像資料庫和網頁伺服器,再往上有腳本語言或者其他高階語言的虛擬機器或執行環境,更上面是應用層面的各種業務邏輯的抽象層次和很多複雜的程式邏輯。
- Linux: 不僅是個執行單元的 Process
*
: Linux 核心對於 UNIX Process 的實作相當複雜,不僅蘊含歷史意義 (幾乎每個欄位都值得講古),更是反映出資訊科技產業的變遷,核心程式碼的task_struct
結構體更是一絕,廣泛涵蓋 process 狀態、處理器、檔案系統、signal 處理、底層追蹤機制等等資訊,更甚者,還很曖昧地保存著 thread 的必要欄位,好似這兩者天生就脫不了干係- 探討 Linux 核心設計的特有思維,像是如何透過 LWP 和 NPTL 實作執行緒,又如何透過行程建立記憶體管理的一種抽象層,再者回顧行程間的 context switch 及排程機制,搭配 signal 處理
- Linux: 不只挑選任務的排程器
*
: 排程器 (scheduler) 是任何一個多工作業系統核心都具備的機制,但彼此落差極大,考量點不僅是演算法,還有當應用規模提昇時 (所謂的 scalability) 和涉及即時處理之際,會招致不可預知的狀況 (non-determinism),不僅即時系統在意,任何建構在 Linux 核心之上的大型服務都會深受衝擊。是此,Linux 核心的排程器經歷多次變革,需要留意的是,排程的難度不在於挑選下一個可執行的行程 (process),而是讓執行完的行程得以安插到合適的位置,使得 runqueue 依然依據符合預期的順序。 - in-kernel HTTP server
*
- 作業
- Week6 隨堂測驗: 題目
- 針對 Homework2 的 Code Review 解說
- 第 7 週 (Mar 31): 處理器架構和並行處理
- 現代處理器設計:原理和關鍵特徵
*
- CS:APP 第 12 章
- Concurrent Programming (並行程式設計)
*
- Linux: 淺談同步機制
*
- Linux: 多核處理器和 spinlock
*
- Toward a Better Use of C11 Atomics: Part 1, Part 2
- Part 1: Mutex Locks
- Part 2: Counting Semaphores
- Part 3: Working with Mutexes And Semaphores
- Part 4: The Critical Section Problem
- Part 5: Condition Variables
- Part 6: Implementing a barrier
- Part 7: The Reader Writer Problem
- Part 8: Ring Buffer Example
- Part 9: Synchronization Across Processes
- 作業
- Week7 隨堂測驗: 題目 (內含作答表單)
- 現代處理器設計:原理和關鍵特徵
- 第 8 週 (Apr 7): 執行緒實作機制, timer 和 signal
- User-level threads / 錄影
*
- Linux: 中斷處理和現代架構考量
*
- Linux: Timer 及其管理機制
*
- Linux: Scalability 議題
*
- 高效能 Web 伺服器開發
- User-Level Thread Library / threads
- 建構 User-Mode Linux 的實驗環境
*
- 作業
- Week8 隨堂測驗: 題目 (內含作答表單)
- User-level threads / 錄影
- 第 9 週 (Apr 14): 組合語言 + 微處理器 + 虛擬記憶體
- CS:APP 第 3 章重點提示和練習
*
: 閱讀 Linux 核心原始程式碼的過程,我們無可避免會面對各式硬體架構的組合語言程式碼,至少應有基本認知,本課程採用 CS:APP 第 3 章的材料 - Arm 處理器
*
: 系列講座導論, 架構和指令集, 基礎指令和開發環境, 虛擬化技術和應用- 你可曾想過,就算選修了電機資訊相關科系大部份的課程,自己仍對每天用的手機,完全沒概念,是不是很沮喪呢?裡頭運作 ARM 處理器,但你知道裡面的 CPU pipeline 如何運作?裡頭的 cache 如何運作?四核心、八核心到底又如何運作?CPU 和 GPU 之間如何通訊?
- 系列講座預計涵蓋 ARMv7-A/M, ARMv8-A/M, virtualization extension, 以及對應的系統軟體技術,像是 big.LITTLE, hypervisor, 和 TEE 的概念介紹
- 為何要掌握數學?
- 即使 Linux 核心內部也大量可見: 從 CPU cache coherence 談 Linux spinlock 可擴展能力議題
- 隱藏在字典裡的數學
- Linux: Add Policy Engine Algorithmic Bloom Filter Entries Register
- 圖解傅立葉分析
- CS:APP 第 6 章重點提示
*
- CPU caches by Ulrich Drepper
- CS:APP 第 9 章重點提示
*
- Linux: 記憶體管理
*
: 記憶體管理是 Linux 核心裡頭最複雜的部分,涉及到對計算機結構、slob/slab/slub 記憶體配置器、行程和執行檔樣貌、虛擬記憶體對應的例外處理、記憶體映射, UMA vs. NUMA 等等議題。 - Linux 核心的 /dev/mem 裝置: 整理中
- Week9 隨堂測驗: 題目 (內含作答表單)
- CS:APP 第 3 章重點提示和練習
- 第 10 週 (Apr 21): 虛擬記憶體 + I/O + 例外處理
- 第 11 週 (Apr 28): 共享記憶體 + 系統呼叫 + 資料結構
- POSIX Shared Memory: 在 Linux 中要實作出共享記憶體 (shared memory) 的機制很多,例如: 1) SysV shared memory; POSIX shared memory; 3) 以 mmap 對檔案進行記憶體映射; 4) 以 memfd_create() 實作跨越行程存取; 本文章探討 POSIX shared memory 的使用,並提供完整應用案例,最後探討相關的同步議題。
- Linux: 賦予應用程式生命的系統呼叫
*
- Linux: 記憶體管理
*
- C 語言: 物件導向程式設計
*
- An Introduction to Cache-Oblivious Data Structures
- 「自動快取資料結構」,特性是無視硬體特定的快取大小,可能達到接近最優化快取的效能;
- 在現代 CPU 多層多種大小的快取架構下,它的理論宣稱其能自動優化在所有層的快取的存儲效率。傳統上電腦科學做偏理論的不太重視實作上的效能,而做實作或硬體優化的則不太重視理論分析。這個學門卻是橫跨了相當理論的演算法分析(需要相當多的進階數學工具),以及相當低階的硬體效能理解;
- 影片: Memory Hierarchy Models
- Google Research 強者的心得: 關於變強這檔事(九)
- Skip List: 置放大量數字並進行排序的資料結構。不用樹狀結構,而改用高度不同的 List 來連接資料。資料結構在概念上可以表示成 Left Child-Right Sibling Binary Tree 的模式。是 Cache-oblivious Algorithm 的經典範例,時間複雜度與空間複雜度與 Binary Search Tree 皆相同,但是實際運作效率比 Binary Search Tree 還要好。
- Linux 核心: A kernel skiplist implementation (Part 1), Skiplists II: API and benchmarks
- Object-oriented design patterns in the kernel, part 1 / Object-oriented design patterns in the kernel, part 2
- Linux: linked list, Queues, Maps, Binary Trees: 錄影
*
/ 共筆 - Week11 隨堂測驗: 題目 (內含作答表單)
- 第 12 週 (May 5): 共享記憶體 + 同步機制
- 解析 Linux 共享記憶體機制
- Linux: RCU 同步機制
*
- C11 atomic variables and the kernel / Linux Documentation: Circular Buffers
- Week12 隨堂測驗: 題目 (內含作答表單)
- 第 13 週 (May 12): 最佳化 + 安全和正確性 + 裝置驅動程式模型
- CS:APP 第 5 章重點提示和練習
*
- CS:APP Assign 5.18
*
- Making C Less Dangerous in the Linux Kernel / 錄影
*
- Linux 核心中各式 C 語言程式設計的安全和正確議題
- Variable Length Arrays are bad and slow
- Explicit switch case fall-through
- Always-initialized automatic variables
- Arithmetic overflow detection
- Hope for bounds checking
- Control Flow Integrity: forward edges
- Control Flow Integrity: backward edges
- 也提供了 gcc/clang 相關的編譯參數
- 解說1, 解說2
- Linux: 裝置驅動程式介面和模型 / 錄影
*
by Greg Kroah-Hartman - How to avoid writing device drivers for embedded Linux / 錄影
*
- Linux: Device Tree / 錄影
*
- Week13 隨堂測驗: 題目 (內含作答表單)
- CS:APP 第 5 章重點提示和練習
- 第 14 週 (May 19): Linux 核心發展回顧 + 網路封包處理
- Linux: 發展動態回顧
*
- How Linux Processes Your Network Packet / 錄影
*
- Kernel packet capture technologies / 錄影
*
- PACKET_MMAP
PACKET_MMAP
在核心空間內配置一塊核心緩衝區,一旦使用者層級的應用程式呼叫 mmap 將前述緩衝區映射到使用者層級時,接收到的 skb 會直接在該核心緩衝區,從而讓應用程式得以直接捕捉封包- 若沒有啟用
PACKET_MMAP
,就只能使用低效率的AF_PACKET
,不但有緩衝區空間的限制,而且每次捕捉封包就要一次系統呼叫。反之,PACKET_MMAP
多數時候不需要呼叫系統呼叫,也能實作出 zero-copy - 圖解 Linux tcpdump
- Week14 隨堂測驗: 題目 (內含作答表單)
- Linux: 發展動態回顧
- 第 15 週 (May 26): FD 和 檔案系統
- 公告:
- 即日起到 6 月 30 日中午請每位學員進行 課程期末專題
- 預計 6 月 30 日 15:00,授課教師會繳交學期成績,在這之前都有補救空間
- Linux 不成文的設計哲學: “Everything is a file descriptor” - eventfd, timerfd, signalfd
- Linux: 檔案系統和虛擬檔案系統設計
*
- Drive your NAND within Linux / 錄影
*
- Flash-Friendly File System (F2FS) / 錄影
*
- Week15 隨堂測驗: 題目 (內含作答表單)
- 公告:
- 第 16 週 (Jun 2): 多核處理器架構
- Multi-Core in Linux
*
- What is NUMA?
*
- A tour of the ARM architecture and its Linux support
*
- Multiprocessor OS
- Week16 隨堂測驗: 題目 (內含作答表單)
- Multi-Core in Linux
- 第 17 週 (Jun 9): 多處理器架構
- Lock-free 程式設計議題
- Multiprocessor OS
- Linux: Scalability 議題
- Linux-Kernel Memory Ordering: Help Arrives At Last! / video
*
- Week17 隨堂測驗: 題目 (內含作答表單)
- 第 18 週 (Jun 16): 多核處理器, 時鐘管理, Real-time
Linux 核心設計 (Spring 2019)
- 第 1 週 (Feb 19): 誠實面對自己
- 課程簡介和注意須知
- 完整解說錄影 (3 小時)
- 每週均安排隨堂測驗,採計其中最高分的 8 次
- 學期評分方式: 隨堂測驗 (25%) + 個人作業 (25%) + 分組報告及專題 (25%) + 自我評分 (25%)
- 歷屆修課學生心得: 張家榮, 陳品睿, 蕭奕凱
- 分組報告示範: ARM-Linux, Xvisor
- GNU/Linux 開發工具共筆: 務必 自主 學習 Linux 操作, Git, HackMD, LaTeX 語法 (特別是數學式), GNU make, perf, gnuplot
- 透過 Computer Systems: A Programmer’s Perspective 學習系統軟體: 本學期教科書 (第 2 週可向助教購書)
- Bit-wise operations / bit-wise 的應用 / 以位元駕馭能量
- bit-field
- What comes after Moore’s Law?: 隨著 Moore’s Law 時代的結束, 通用化硬體效能不再如以往快速進步, 因此軟硬體也必須因應如此的變化, 這篇點出 4 個面向:
- Ephemeral applications (短暫的軟體): 這點是以企業軟體來談,許多組織的觀點認為軟體壽命比運作其的硬體來得長久。在許多大企業依然如此,然而後續將大量導入 mobile, web, analytics 與其他軟體,更趨向快速轉變以符合客戶與市場所需;
- New workloads, such as machine learning: 呼應諸多計算架構大師所說的 Domain-Specific Architecture (DSA);
- Cloud platforms: 對於雲端應用而言,使用者不會在意它是在哪種處理器與加速器上運作的;
- Open source software: 主要在於特定的軟體開發商因人力與成本而減少支援硬體的範圍,開放原始碼軟體這時能夠作為考慮方案。儘管無法消弭對硬體的相依性,但不像軟體開發商對硬體平台支援或不支援的要求;
- The Era of General Purpose Computers is Ending: 過往是研究員和從業者就設計瓶頸與發熱問題來說明困境,這篇則由製程發展與已發生的現象,討論以下變遷:
- 能追上最先進製程的晶圓廠商越來越少
- TOP 500 中使用特殊晶片比例不斷上升
- 特殊化處理器各方面變得更為經濟實惠
- linked list 和非連續記憶體操作 / linked list 題目分析
- 作業
- 課程基本資料表單 務必填寫,以接收課程資訊
- Week1 隨堂測驗: 題目 / 作答表單
- 課程簡介和注意須知
- 第 2 週 (Feb 26): C 語言程式設計
- 第 1 週發展回顧
- 系統軟體開發思維
- 為什麼要深入學習 C 語言?
- C 語言發明者 Dennis M. Ritchie 說:「C 很彆扭又缺陷重重,卻異常成功。固然有歷史的巧合推波助瀾,可也的確是因為它能滿足於系統軟體實作的程式語言期待:既有相當的效率來取代組合語言,又可充分達到抽象且流暢,能用於描述在多樣環境的演算法。」
- 解讀計算機編碼 / 重新理解數值 / 浮點數運算和定點數操作
- 基於 C 語言標準研究與系統程式安全議題
- 藉由研讀漏洞程式碼及 C 語言標準,討論系統程式的安全議題
- 透過除錯器追蹤程式碼實際運行的狀況,了解其運作原理;
- 取材自 dangling pointer, CWE-416 Use After Free, CVE-2017-16943 以及 integer overflow 的議題;
- C 語言:記憶體管理、對齊及硬體特性
- C 語言: 指標
- C 語言: 函式呼叫
- C 語言: 遞迴呼叫
- 課堂互動工作區
- 作業
- Week2 隨堂測驗: 題目 / 作答表單
- 第 3 週 (Mar 5): 編譯器和連結器
- 核心開發者當然要熟悉編譯器行為
- C 語言: 未定義行為: C 語言最初為了開發 UNIX 和系統軟體而生,本質是低階的程式語言,在語言規範層級存在 undefined behavior,可允許編譯器引入更多最佳化
- C 語言: 編譯器和最佳化原理
- C 語言: 連結器與程式行為
- C 語言: 動態連結器
- C 語言: 執行階段程式庫 (CRT)
- C 語言: 前置處理器應用
- C 語言: goto 和流程控制
- C 編譯器原理和案例分析
- C 語言程式設計技巧
- 課堂互動工作區
- Week3 隨堂測驗:
- 第 4 週 (Mar 12): 計算機架構
- 重要事項宣達: Homework2 繳交截止時間調整為 3 月 19 日中午
- Linux-based RTOS Experimental Platform for Constructing Self-driving Vehicles
- CS:APP 第 3 章重點提示和練習
- 現代處理器設計:原理和關鍵特徵
- Arm 處理器: 系列講座導論, 架構和指令集, 基礎指令和開發環境, 虛擬化技術和應用
- 你可曾想過,就算選修了電機資訊相關科系大部份的課程,自己仍對每天用的手機,完全沒概念,是不是很沮喪呢?裡頭運作 ARM 處理器,但你知道裡面的 CPU pipeline 如何運作?裡頭的 cache 如何運作?四核心、八核心到底又如何運作?CPU 和 GPU 之間如何通訊?
- 系列講座預計涵蓋 ARMv7-A/M, ARMv8-A/M, virtualization extension, 以及對應的系統軟體技術,像是 big.LITTLE, hypervisor, 和 TEE 的概念介紹
- 虛擬機器設計與實作
- Linux: 透過 eBPF 觀察作業系統行為: 動態追蹤技術(dynamic tracing)是現代軟體的進階除錯和追蹤機制,讓工程師以非常低的成本,在非常短的時間內,克服一些不是顯而易見的問題。它興起和繁榮的一個大背景是,我們正處在一個快速增長的網路互連異質運算環境,工程人員面臨著兩大方面的挑戰:
- 規模:無論是使用者規模還是機房的規模、機器的數量都處於快速增長的時代;
- 複雜度:業務邏輯越來越複雜,運作的軟體也變得越來越複雜,我們知道它會分成很多很多層次,包括作業系統核心和其上各種系統軟體,像資料庫和網頁伺服器,再往上有腳本語言或者其他高階語言的虛擬機器或執行環境,更上面是應用層面的各種業務邏輯的抽象層次和很多複雜的程式邏輯。
- 作業
- Week4 隨堂測驗:
- 第 5 週 (Mar 19): Linux Process/Thread
- Microkernel 設計和真實世界中的應用
- Linux: 不僅是個執行單元的 Process: Linux 核心對於 UNIX Process 的實作相當複雜,不僅蘊含歷史意義 (幾乎每個欄位都值得講古),更是反映出資訊科技產業的變遷,核心程式碼的
task_struct
結構體更是一絕,廣泛涵蓋 process 狀態、處理器、檔案系統、signal 處理、底層追蹤機制等等資訊,更甚者,還很曖昧地保存著 thread 的必要欄位,好似這兩者天生就脫不了干係- 探討 Linux 核心設計的特有思維,像是如何透過 LWP 和 NPTL 實作執行緒,又如何透過行程建立記憶體管理的一種抽象層,再者回顧行程間的 context switch 及排程機制,搭配 signal 處理
- Linux: 不只挑選任務的排程器
- Linux 核心設計: 第 5 週課堂互動工作區
- 作業
- 第 6 週 (Mar 26): 軟體最佳化和數學原理
- 公告
- 4 月 2 日停課一週,安排學生帶試卷回家測驗 (所謂的 take-home test)
- video: 為什麼要學數學?
- 倖存者偏差: 只考慮到偏頗的統計數據
- 用線性思維來思考所有事物導致的謬誤
- 黑天鵝事件
- 萬物都有對應的數學模型,而掌握數學就是掌握一種認知的工具,得以更清晰地認識世界
- 為何要掌握數學?
- CS:APP 第 2 章重點提示和練習
- 圖解傅立葉分析
- 公告
- 第 7 週 (Apr 2): 停課一次
- 第 8 週 (Apr 9): 記憶體階層
- CS:APP 第 3 章重點提示和練習
- CS:APP 第 6 章重點提示
- Cache 原理和實際影響
- software-pipelining
- CPU caches by Ulrich Drepper
- 第 9 週 (Apr 16): 虛擬記憶體
- 第 10 週 (Apr 23): I/O 與例外處理
- 第 11 週 (Apr 30): 資料結構
- C 語言: 物件導向程式設計
- Functional Programming 風格的 C 語言實作
- 是種 programming paradigm (開發典範),不是 design pattern 也不是 framework,更不是 language。簡單來說,FP 是種以數學函數為中心的「思考方式」與「程式風格」;
- 透過 C 語言程式提供若干案例,如列舉數值、(不需要動態配置記憶體的) 反轉 linked list 元素、對 Linked List 元素進行合併排序;
- An Introduction to Cache-Oblivious Data Structures
- 「自動快取資料結構」,特性是無視硬體特定的快取大小,可能達到接近最優化快取的效能;
- 在現代 CPU 多層多種大小的快取架構下,它的理論宣稱其能自動優化在所有層的快取的存儲效率。傳統上電腦科學做偏理論的不太重視實作上的效能,而做實作或硬體優化的則不太重視理論分析。這個學門卻是橫跨了相當理論的演算法分析(需要相當多的進階數學工具),以及相當低階的硬體效能理解;
- 影片: Memory Hierarchy Models
- Google Research 強者的心得: 關於變強這檔事(九)
- Skip List: 置放大量數字並進行排序的資料結構。不用樹狀結構,而改用高度不同的 List 來連接資料。資料結構在概念上可以表示成 Left Child-Right Sibling Binary Tree 的模式。是 Cache-oblivious Algorithm 的經典範例,時間複雜度與空間複雜度與 Binary Search Tree 皆相同,但是實際運作效率比 Binary Search Tree 還要好。
- Linux 核心: A kernel skiplist implementation (Part 1), Skiplists II: API and benchmarks
- Object-oriented design patterns in the kernel, part 1 / Object-oriented design patterns in the kernel, part 2
- Linux: linked list, Queues, Maps, Binary Trees: 錄影 / 共筆
- Week 11 隨堂測驗:
- 作業
- 第 12 週 (May 7): 同步機制
- Announcing WSL 2
- WSL (Windows Subsystem for Linux) 是 Microsoft 提供可免費下載和使用的軟體,可讓您直接在 MS-Windows 上執行原生 Linux 命令列工具與傳統 Windows 桌面,而不需要額外的虛擬機器;
- 現在為了強化相容性,WSL 2 乾脆附上真的可執行的 Linux 核心 (!) 並透過虛擬化技術,高效率地執行,目前公佈的材料指出,檔案系統方面的效能提升了 20 倍,而且 Docker 一類的容器可更好地運作;
- 這項變更預計隨著 Windows Update 釋出,預計會有全新 Windows Terminal,並且開放原始碼,關鍵特徵包含支援 Tab 和透過 GPU 加速文字描繪處理
- CS:APP 第 12 章
- Concurrent Programming (並行程式設計)
- Linux: 淺談同步機制
- Linux: 多核處理器和 spinlock
- Linux: RCU 同步機制
- C11 atomic variables and the kernel / Linux Documentation: Circular Buffers
- Toward a Better Use of C11 Atomics: Part 1, Part 2
- Part 1: Mutex Locks
- Part 2: Counting Semaphores
- Part 3: Working with Mutexes And Semaphores
- Part 4: The Critical Section Problem
- Part 5: Condition Variables
- Part 6: Implementing a barrier
- Part 7: The Reader Writer Problem
- Part 8: Ring Buffer Example
- Part 9: Synchronization Across Processes
- Announcing WSL 2
- 第 13 週 (May 14): 電腦網路和裝置驅動程式模型
- 填寫分組表格
- video: How TCP/IP Works
- CS:APP 第 11 章重點提示
- Making C Less Dangerous in the Linux Kernel / 錄影
- Linux 核心中各式 C 語言程式設計的安全和正確議題
- Variable Length Arrays are bad and slow
- Explicit switch case fall-through
- Always-initialized automatic variables
- Arithmetic overflow detection
- Hope for bounds checking
- Control Flow Integrity: forward edges
- Control Flow Integrity: backward edges
- 也提供了 gcc/clang 相關的編譯參數
- 解說1, 解說2
- Linux: 裝置驅動程式介面和模型 / 錄影 by Greg Kroah-Hartman
- How to avoid writing device driversfor embedded Linux / 錄影
- Linux: Device Tree / 錄影
- Week 13 隨堂測驗:
- 第 14 週 (May 21): 作業回顧
- video: The kernel report 2018: 對應於 v4.20
- 分組表
- Homework5
- Homework6
- 課堂互動區
- 第 15 週 (May 28): 檔案系統
- video: Introduction to Memory Management in Linux
- slides 任職於 SoftIron (銷售 64-bit ARM 伺服器的公司,提供豐富的軟體支援) 的 Alan Ott 以 “Introduction to Memory Management in Linux” 為題,在 ELC 發表演說,非常精實,一口氣回顧計算機組織結構 (根本就是真人版本的「十分鐘理解記憶體管理」),並深入淺出地探討 Linux 的各項設計 涵蓋 CONFIG_PAGE_OFFSET 的切割、swap, page fault, mmap/brk/sbrk, kmalloc()/vmalloc(), DMA 等等。
- Linux: 檔案系統和虛擬檔案系統設計
- Drive your NAND within Linux / 錄影
- Flash-Friendly File System (F2FS) / 錄影
- PACKET_MMAP
- Binding the socket to your network interface is mandatory (with zero copy) to know the header size of frames used in the circular buffer.
- Week 15 隨堂測驗:
- video: Introduction to Memory Management in Linux
- 第 16 週 (Jun 4): 多處理器架構和 Scalability
- 第 17 週 (Jun 11): 多處理器架構和 Real-time
- 第 18 週 (Jun 18): 多核處理器和時鐘管理