版本 64aefe871aba088dd1d8b6994cf80dcb173d525e

yenWu (吳彥寬)

簡介
工作經歷
開放原始碼專案參與
競賽成果
貢獻研討會筆記
學術影片分享
(2016_春季班)作業及筆記
(2016_秋季班)作業及筆記
聯絡資訊

簡介

成功大學數學系104級倒數第四名畢業(2012 ~ 2015)
成功大學資訊工程所106級(2016 ~ 2017)

工作經歷

VMFive 實習生 - APP Streaming Team/ 成果發表

開放原始碼專案參與

apitrace
seL4 microkernel [p1,p2]
mini-arm-os
threadpool

競賽成果

2016 NVIDIA Taiwan Embedded Vision Smart Robot Challenge
- 決賽/ 作品ART(Awesome Robot Team)/ 開發筆記

貢獻研討會筆記

新竹碼農聚會
- 自幹IoT 專屬OS-HyperC/ 筆記
- Meet-cute between eBPF and Kernel Tracing/ 筆記
2016台灣資料科學愛好者年會
- 視覺訊息處理和深度學習應用/ 筆記
Mediatek 資深工程師演講
- SIMD Programing Introduction/ 筆記

學術影片分享

Taiwan Linux Kernel Hacker
- “Introduction of the BSD Packet Filter”/ 影片/ ppt
Paper Study
- “L4 microkernels: The lessons from 20 years of research and deployment”/ 影片/ ppt
課堂分享
- SIMD introduction/ ppt
- seL4 introduction: Capability–based Access Model/ 影片/ 筆記

(2016_春季班)作業及筆記

那時是旁聽生，而且沒有做期末專題，專心準備 Nvidia比賽

HW1 / 開發紀錄(phonebook) / 程式碼
- 改善phonebook查詢的效能，中間使用了改變資料結構 Hash function，並使用perf做效能偵，gplot建制清楚的圖片
HW2(a)/ 開發紀錄(A)(raytracing) / 程式碼(A)
- 改善raytracing程式的效能，使用 loop unrolling inline function SIMD Mult-threads，並使用gprof 檢查那一個function用最多時間，以及使用gdb 抓出breakpoint，並且打敗compiler將最佳效能-O3的效能
HW3_server-framework/ 開發紀錄(server-framework)/ 程式碼
- 改善server的效能，讓每秒可以 reply 的 request 增加，使用大量的function pointer，還學習到 signal的用法，和pipe的process之間的溝通，目前最卡關的地方是將 blocking I/O改寫成lock-free

(2016_秋季班)作業及筆記

HW1(a)/ 開發紀錄(phonebook) / github / youtube link(update 2016/10/1)
- 這次我挑戰了如何降低 append() time，也就是建立時間，我這次使用到了mmap的技術來降低讀取大量資料的時間，很有趣的，做完後發現建立的時間居然可以快過查詢的時間XD，當然，之後又使用了muti-thread來減少搜尋時間，並且意外地開啟了新的課程作業，也就是 phonebook-concurrency。
HW1(d)/ 開發紀錄(clz) / github / [youtube link]
- 這次的作業是 Count Leading Zeros (clz)，我實作了recursive, iterative, binary-search, byte-shift and Harley's version，而這個作業最有趣的就是 Harley's algorithm，他像是一個填空題，我的解題絲路很有趣XD，我先嘗試假設這個演算法是正確的，那就是我代入0x4,0x5,…,0x7出現的答案都應該要是正確的，也就是說這個演算法有辦法，把他們都變成一模一樣，所以那之後再去算答案當然會一樣樓XD，而這個算法在我現在做的 RTOS schedule 設計上也有很大的起發，而 clz 也有使用到，在做之前根本想不到的。
HW2/ 開發紀錄(phonebook-concurrent) / github / [youtube link]
- 這作業的原始範本就是我的 phonebook，而這次作業的主題是refactor和threadpool，而說到refactor就真的非常對不起了…，因為我在寫phonebook時很多變數、function 命名都很隨便，幾乎沒什麼註解，連我自己都改得很辛苦…，於是我趕緊在拍另一部影片我把的 flow都講出來youtube，而在threadpool設計時，也順便貢獻了參考的mbrossard/threadpool。
HW3(b)/ 開發紀錄(software-pipelining) / github / youtube link
- 這個作業的主題是software-pipeline和SIMD，讓我了解到了原來 software也會有 pipeline，而這個 pipeline的方法別無他法，就是你要非常熟悉硬體設計，而其中的論文選讀是我當時讀過最長的論文(27p，目前看到最長的是 formal verification的論文 83p)，這篇論文從計算機結構來分析hardware prefetch,software prefetch的使用時機和效率，令人驚呀的是只要做足 pipeline，程式的效能居然還可以再上升 1倍，miracle，再來就是SIMD由於他是一次要fetch大量的data，所以他在software-pipeline有莫大的效果，另外這個作業最大的收穫就是得到很多大神的幫助，大家給我的方法我都有去 try try看，而讓我真的學到非常非常多，something that raw counter, different perf tools …
- 這個作業我也將我的很多問題帶去給，Champ學長(第一屆)，並統整了一份資訊，並在課堂上以演講的方式分享給同學們，SIMD introduction
分組
- HW3(a)/ 開發紀錄(mergesort-concurrent)/ github / youtube link
  - 這個作業我們被指派要改變data structure，使得 list的 element能夠在 insert和 delete時能夠更 flexible，這其中我們嘗試建構出之前老師所謂的效能分析，所以從基礎建設跟自動化跑數據，再來是用 doxygen來分析 code的組成，最後我們有使用Atomic來包裝變數，並達到小部分lock-free的實作，來改善 threadpool，至於 data structure的部分，我們嘗試使用 binary tree的架構，但這樣連 mergesort都必須要重新實作，這是尚未完成的部分。
- HW4(a) / 開發紀錄(jit-compiler) / github / youtube
  - 這個作業是要改善brainf**k的效能，方法有interpreter,compiler,just-in-time compiler，而這也是我第一次接觸這兩個 optimize的方式，從 turing machine的觀點切入 brainf**k，並在這途中思考brainf**k的開發流程，最後藉由這個點切入優化code的部分。
- Final Project / 開發紀錄(F9 microkernel & ARM hypervisor)
  - 在這個 Project裡，我被分配從 codezero->f9-kernel->seL4 microkernel->bitsec->mini-arm-os->pico->SST_ARM->rtenv-plus一路研究過來，就為了能夠真正開發一個 OS，途中我已經被程式面對自己數次，破英文、闡述能力太爛、效率、學習不夠精實、…，我也體會到什麼叫看 document看到死，這是我覺得進步最多的時刻，也是我覺得最辛苦的時刻，同時也是我覺得我可以實現第一次跟老師相遇時的目標，開發一個 OS。
  - 我也對 sel4 的 capability model 做了一個解說，seL4 introduction: Capability–based Access Model/ 筆記

聯絡資訊

e-mail: c14006078@gmail.com

Github: yenWu

Linkin: Yen-Kuan Wu