over 4 years ago

前天,應母校 文化大學應用數學系 的邀請,再次回系演講關於大學後的職涯規劃。這已經是第二次受邀演講相同的主題。受邀的原因相當單純。純粹是我的表現一再的讓系上老師跌破眼鏡,在短短數年間一路從不起眼的小職員,迅速累積出社會普世價值觀上相對可觀的成就。( T客邦技術部經理、HTC 資深經理、Facebook World Hack Grand Prize…etc.) 所以老師們想邀請我回校演講。分享我在這一路上成長的感想,並給予學弟妹人生建議,回答對於對於將來路上的一些疑惑。

會後的問題,我一路上其實在各大場合都答過類似的問題。內心對於大學生缺乏適當明燈指引,相當感慨。有些問題我想甚至可能只有我這樣的經歷的人,才可能答的出來。這些建議我覺得若只限於在校學弟妹才能聽到,相當可惜。所以趁記憶猶新,把它整理出來。

當然,這只是基於我的人生經歷,做出來的建議。並非絕對,還請讀者自行判斷斟酌。

最值得投資的技能

1. 中文速讀

我最常被問到的問題其中有一個是:「你覺得出社會前你練過最值得的技能是什麼?」對於這個問題,我的答案毫不猶豫的會是「中文速讀」。

為什麼是「中文速讀」?坦白說,在小時候會選擇投資這個技能,原因純粹是 (1) 被逼 (2) 我有天份 (3) 可以在短時間看完一堆雜文小說很爽。

18 歲前,「速讀」這個技能對我來說,是可有可無的雞肋。但是在 18 歲以後,遇上網際網路的高速成長,整個世界呈現一個「資訊爆炸」的狀態。原先的雞肋技能,搖身一變成為我一路上闖蕩的最厲害武器。

原本我個人學習的速度,還被大大牽制在老家附近的書店販售書種的數量。因為網際網路的爆炸性成長,我的閱讀視野一下子被拉到網際網路的邊界。而高速的閱讀速度,即便在資訊爆炸的今天,我還是能夠只花上極少時間,就能夠輕鬆追完今日關注 timeline 上的大小事…

工作上遇到任何疑難雜症,也能透過閱讀速度以及網際網路,快速的整理出相對應的解決方案。

如果時間只能投資在一個專業技能上,我毫不猶豫會推薦你選擇「中文速讀」。

2. 英文能力

其次,我推薦練習的技能就是「英文能力」。每當學弟妹聽到我這樣說,無不哀號遍野,瞬間卻步。

其實,學弟妹不知道的是:所謂的「英文能力」真的非常非常重要。重要到超乎你想像。我出社會到現在的感想是,「英文能力」的重要性也遠超乎我當年的想像。

不只是所謂好的工作需要英文(外商工作需要聽說讀寫)。甚至是幫助你高速成長,超車過同儕的專業知識也通通都是英文 (如同我現在賴以為生的專業技能: Ruby on Rails )。就別說這麼專業的進階知識好了。

就連外國的許多線上初階自助學習課程:CodeSchoolCodecademy。也都是英文教材。

其實台灣不乏素質高的軟體人才、學生。其實只要正確的導引,具備適當的教材與練習,成果往往能突破目前國民教育造成的限制。唯一可惜的是,大家往往只要聽到「是英文的」,下意識就刪掉這個選項。我一直覺得這是一件可惜的事。

很多學弟妹也許會期待,將來這些東西有天會有好心人出中文版。就我的觀察,這個機會可能是越來越小。目前的現實是:這個世界呈現高速成長中,能夠翻譯這些知識的人,往往也是能夠少數能夠突破天際線以及國際限制的人。他們目前的聚焦,無不是專注在自身能力與事業的突破。很少能夠還有資源和時間能夠停下來拉別人…

於是造成了一個極端的現象:強者越強,弱者越弱。甚至就算強者有心停下來救別人,有時候往往也不知道怎救起...

大家對於「英文學習」的盲點,在於英文學習很枯燥,無法靜下心來投資一個「不知道有什麼報酬率」的知識。

其實各位可能不知道的是:在大學之前,我的英文能力也非常非常的弱,每次段考都只有 30 分。但是我現在的英文能力,卻能讀聽能說能寫(哈,抱歉,有時候 blog 還是一堆 typo 錯字)。跟外國人順暢的聊天和工作的能力我應該還算是不錯的。

如今我具備的所有專業知識與能力,甚至是得到的機運,也全部都是因為英文賺進來的。

現在回頭看,英文練得起來的原因,只是因為我的一個單純的小嗜好:「看美劇」。其實把英文練好並沒有那麼難。我雖然不喜歡「嚴肅的學英文」,但卻非常喜歡看美劇(含字幕)。劇情精彩是我當初被深深吸引的一個原因,十年來我看過不下千集美劇。

習慣美國人講話的速度,是我進步的第一環。習慣了聽美國人講話,自然腔調與口語速度就會自然而然接近美國人。聽說能力就自然起來了。

因為不害怕英文,在需要大量接觸英文的程式開發專業環境下,就會完全不覺得英文是什麼可怕的門檻。很快的,自己就會習慣「太平洋其實並沒有加蓋」這件事。

能夠接觸到的機會,看到的世界,就不會被所謂的「台灣洗腦電視台」蓋台進入無窮迴圈。(其實我已經接近十年沒有在看台灣新聞與連續劇了…)

我認知到的一件現實是,現在全球已經進入非常扁平化而且快速變革的激烈變化中。如果國家國力本身夠強,還抵的住這種變化的衝擊。但是台灣,在經過這四年政府無作為且大量惡搞的狀況下,本地機會迅速的惡劣、變小、變少。

如果不能夠把自己變成全球需要的人才,將很快的被這波洪流吞噬。如果你的英文能力不好,勢必只能是被吞沒的那一群人…

3. 寫作能力與程式開發能力

其三,我認為值得投資的部分是:「寫作能力」或者是「程式開發能力」。

每當我一提到這兩件事,也是很多人馬上會皺起眉頭。

但我一路上走來的感想是:我很高興能夠同時都把這兩塊能力練得不錯。而且是這兩個能力,才把我帶到今天這條路上。

(也許你認為我能夠拿到 Grand Prize of Facebook World Hack,是個程式奇才,其實我可以很清楚的跟你說:我明白自己不是寫程式的料。

我真正有狂熱興趣的是寫作以及作產品。我小學立志當作家或歷史學家。成為一個厲害的 Developer 從來不在我念大學之前的志願選項。

我只是喜歡作網站,我被迫去學 coding,去學有關 coding 的 everything,然後莫名其妙的就被迫站在這個領域的前端…

寫作能力與程式開發能力,帶給我的影響是:

  1. 寫作能極大化的強迫把我沒有章法的思緒收斂在一起,當累積到能夠把想法準確的寫下來,並重複的寫到讓人家明白。最大的受益人其實是我自己,我透過寫作梳理以及掌握了整件事的來龍去脈。能夠把事情精準的重複,才是弄懂整件事。透過不斷的寫作可以大大強化「把事情想清楚」這方面的能力。

  2. 程式開發也是類似的事。Knuth 曾經說過 「A person does not really understand something until after teaching it to a computer」。電腦並沒有很聰明,它只能執行絕對有邏輯的事情。換句話說:你在教電腦事情的時候,其實是在釐清自己的思考與整件事的邏輯。沒有邏輯的事,你又如何期待可以被 work 呢?

而培養寫作能力與程式開發能力,其實最大的好處不是培養出強大的邏輯核心能力群。而是產生出來的副產品:「文章」以及「程式碼」。

很多 Developer 常常怨歎,我也很有能力,為什麼沒有人要挖掘我?很簡單的道理,因為沒有人知道你作過什麼。沒有文章放在 Blog 上,沒有程式碼放在 Github 上,沒有可以實際端出的 project。光憑短短的幾分鐘面談,和洋洋灑灑履歷。誰能在這麼短的時間,知道你是不世出的曠世奇才呢?

如果你想要世界看到你,你必須要做的就是,主動站出來。

小結

現在的社會絕對不是爸媽從小告訴你的那樣:只要專注「上學唸書」,找份「穩定的工作」就能安穩一輩子的社會。相反地,這個社會正用以往沒有的速度,每半年每三個月就快速演化一次。

以具體的例子來說,就看看你身邊的電腦、平板、手機演化趨勢就知道了。2007 年之前有誰能預期到 Facebook 能夠演化成如此怪獸?

世界上的工作型態以及職務需求,也在這幾年間劇烈的變化。昨天在蔡依橙醫生的部落格上面看到這一段話:『至於台北,他們根本不想拿來比較。我們還在講古老的「四小龍」攀關係,人家已經在亞洲制霸的路上了。』

在台灣媒體的鎖國洗腦下,其實很多人不知道,台灣已完全從先進國家之林掉出去了。很多人以為選出馬英九,即使無能不做事,其實也不可能把國家害到多慘的境界。這真是大錯特錯,在 2007 年以前,台灣與世界的差距真的還沒有那麼大。2008 以後的這黃金四年,全世界都在往前衝,以每三個月一變的速度在進化,只有台灣還在原地沾沾自喜的原地踏步。四年過去了,我們國家以及人民的競爭力完全不知道掉到哪裡去。

我不是跑得很前面的人,我真的只是勉強跟著世界的速度一起跑而已。

很多學弟妹常直接希望我給他們一些將來就業方向上的建議,該選什麼學科好,該選什麼職業好。老實說,在這麼瞬息萬變的社會改變裡,我實在無法告訴大家,什麼職業絕對賺,絕對不會被淘汰。因為這種事已經很難繼續再被持續發生了。

但無論如何,至少我可以告訴大家,如何不被世界變化的速度甩開....我認為這三項核心能力是至關重要的。無論社會再怎麼變,至少你還可以靠這三個核心技能維持個人的競爭優勢。

  • 中文速讀
  • 英文能力
  • 寫作 / 程式能力

這一篇是關於「什麼技能建議學」。下一篇的主題我將談「什麼樣的決定不要作」。

 
over 4 years ago

paperclip.io 是我與 zhusee 最近奪得 Facebook World Hack 大賞 的作品。T 客邦在 Facebook 公布大賞得獎名單後 (10/15) 第一時間採訪了我們

獲得 T 客邦 授權,將 12 道採訪內容轉貼回來我的部落格。


1、為什麼會選擇開發 Paperclip.io 這樣的服務?你們發現了什麼樣的需求?這個點子是怎麼來的?

我平常在使用 Facebook 時,到不錯的連結或頁面就會順手按讚。但是,按完讚之後過後想找自己前幾天曾按過什麼連結,卻很麻煩。Facebook 一直沒有一個入口介面可以讓你找之前讚過什麼。我認為這件事造成我相當大的困擾,就覺得應該要有一個開發者來寫一個這樣的 App 幫助大家....但很明顯應該是沒有人要寫,於是我就打算自己寫。

剛好 Facebook 舉辦這次比賽,我就打算拿來當這次的題目。

2 、在 Facebook Developer World HACK 2012 裡面,因為每個站都是一天的活動,而且比賽時間只有幾個小時,在這麼短的時間內,你們做了什麼準備,讓作品可以贏得比賽?
選題

首先,我認為是「選題」吧。這是一個「夠小」而且「解決真正大眾困擾」的題目。如果我們選擇進行這個題目。可能題目賣相就會高一點。(我猜)

專注

其次,我認為是「專注」。因為這個「題目」夠小,我們可以把我們的火力集中在於完成核心的實作。主要核心就只是兩隻 API 爬蟲 和網頁爬蟲。這兩個部分很快就寫完了,我們剩下的精力都在調整介面的順暢度。

賣相

第三,調整 demo 時的賣相。因為上台前需要寫投影片和 live demo 自己的作品,demo 只有短短的 5 分鐘,我必須在這麼短的時間內讓評審和其他的參賽者,一目了然知道我們的服務在做什麼,解決了什麼問題。於是我註冊了一個假帳號負責 demo,這裡面的內容是我精選過的,可以看完之後就了解我們在做什麼(我本人 like 過的資料其實很雜亂)。 讓評審能夠一下子理解我們想要作什麼,解決了什麼問題。我想也是拉高勝率的一大原因。

炫技

第四,介面炫技。zhusee 是一個很強的前端工程師,我經常提了一堆的點子,他馬上就能用很炫的方式實作出來。我們嘗試在 demo 前能夠讓所有的介面非常的流暢(即便是等待時間)。另外也花時間做了高難度的首頁特效,吸引目光焦點(畢竟是 Hackathon….當然要炫耀一下)。

3、在整個活動過程中,讓你們印象最深刻的事情是什麼?

參賽的台灣隊伍都很強很有創意。我不知道原來大家會拿 Facebook API 惡搞出這麼多的創意。比如說 Memory Millionaire,我就覺得他們的點子相當有意思。

在宣布三大獎項之後,我們其實一度很失望…一度以為自己落選了。

直到評審宣布評審特別獎,我們發現得獎名單也沒有我們(這也落選會讓我受到很大打擊XD),我們才猜測可能是我們拿到了首獎!!

4、開發 Paperclip.io 總共用了多少時間?在這個過程中,有沒有遇到什麼樣的難關?

其實在比賽之前,我有試寫了一個很小的 prototype,練習 FB API 的存取,但是,成品很糟,存在很多問題。但是因為已經熟了 FB API,我大概覺得這個網站主體架構,在比賽的時限之內,我是有把握可以做完的。

原始設計存在不少問題,用改的拿去比賽太麻煩了。我決定到現場重寫一遍。我們從上午九點到會場,就一直馬不停蹄的在寫 code,寫到開始 demo,所以我也不清楚我們整整寫了多久。

不過中間的確有遇到幾個重大難關:

首先是網頁的爬蟲演算法優先順序問題,當初在設計時,設計的 worker 演算法不好,會造成前面使用者資料沒抓完,後面使用者資料就無法開始進行。這在使用者體驗上會非常不好,因為使用者會覺得網站壞掉了。於是我們花了幾乎整整一個小時打掉原先的 worker 重新設計。

再來是搜尋索引效率的問題,我們嘗試讓這些連結是可用關鍵字被搜尋的,但是資料是分批分批抓進來的,所以會有異步索引的問題。我一直都無法好好的解決這個問題,最後心一橫,不解決了。直接用 MySQL 全文檢索…

不然我們可能會被迫在上台前拿掉這個 feature(但我認為搜尋是一個很大的賣點)。

5、Paperclip.io 隊伍的成員有兩位,你們之間如何分工?

我(xdite)主寫整個網站的架構,設計爬蟲、梳理流程、製作投影片以及上台簡報。zhusee 實作強大的視覺特效以及繪製精美的 UI。我會先把需要加工的頁面在第一時間寫出來,交給 zhusee 操刀設計,我們用 git 控制程式碼,基本上可以做到全速各寫各的,毫不干擾。

6、在 Paperclip.io 的功能裡,有個 Recipes 的分類,讓人很好奇為什麼會特別把食譜做個分類出來?又,書本、食譜這兩個分類的內容,是怎麼去判斷的呢?

在把整個網站初稿寫出來之後,我們認為這個網站如果只有連結實在太單薄了....

於是我們決定加一些分類。分類就是按照 og:type 去分,我們發現有幾個 type 做出來的視覺效果不錯,如:Youtube、食譜、Github …於是我們就決定把這些功能加進去了。

7、在得獎之後,是不是打算升級 Paperclip.io 網站的硬體資源,讓匯入的資料可以更快跑出來?

這個網站吃的資源真的很驚人,我不確定我能不能一直養著它…

說到這個,其實在現場邀請一些朋友幫忙測試時,我們就發現一些效能上的問題了。於是,我們還在當場做了一個非常大的賭注,就是現場刷卡升級 linode 機器(伺服器)。這時候已經快要接近 demo 時間了,要是升級當場出了什麼問題,或者機器來不及當場升級完畢,我們可能就直接開天窗了… 還好這件事並沒有發生。

8、對於想要參加類似 Hack 活動的人,有什麼樣的建議?

我參加過好幾次 Hackathon,得過兩次獎。一次是 2008 年的 Yahoo Open Hack Day(那次是公司同事一起出去比賽,作品是「和多繽紛樂」,得了亞軍)。一次就是 2012 年的這次 Facebook World Hack 得到首獎。

在這好幾次的參賽經驗中,我得到幾個寶貴經驗:

(1) 好的題目很重要

評審希望得獎的題目是 valuable 的。搞笑、諷刺、主題模糊的題目,一定不會得獎。(我在 2009 的比賽跟一群大神等級的朋友合作做了一個精美的搞笑網站「我是專家」,但是…我們沒有得獎)

(2) 賣相非常重要

有些 Hackathon 比賽,甚至投影片比網站重要…。有某幾次的 Hackathon 比賽,竟然是投影片贏了網站。這讓我覺得很不公平也很無奈。但我也理解到比賽要贏就需要賣相的現實。 雖然這次 Hackathon 大會是要求需要提供 source code 以證明不是投影片的實戰比賽,舞弊不至於發生。但我還是認真的投資了快要一個小時在調整假 demo 帳號、截圖、寫投影片.....

9、接下來還會參加其他 Hack 活動的計畫嗎?

暫時沒有。因為我們忘記報名今年的 Yahoo Hack Day 比賽。但我想沒有關係,今年拿到這個獎就值得了…

10、如何把 Bootstrap 改得這麼好看?

我們用了一些網路上的免費素材,比如說

簡單抽換了一下材質,然後用了一點 CSS3 技巧,提升介面質感。這些都是我們平常開發時就相當熟練的技巧,用得很自然。

11、從零到完成作品,用了很短的時間,這是怎麼做到的?有什麼樣的密技?工作進度如何管理?是有什麼樣的開發好習慣嗎?

我想主要是幾個重點:

(1) 時間管理

我參加過很多場 Hackathon。大概知道寫 code 時最容易踢到什麼鐵板。或者開發中最容易遇到什麼鬼打牆的事情。

比賽通常只有短短的幾個小時,所以你要把最浪費時間的部分想辦法節省掉。比如說:如果當天再討論 idea,你的時間就很有可能不夠用。網站需要佈署,佈署需要測試,所以最好有只要一鍵就能 deploy 的環境。domain name 全球生效需要時間,所以 domain name 最好先買。

現場再搞這些事,網站鐵定作不完。何況最後至少要留半小時寫投影片....

(2) 知道什麼該放棄

因為時間不夠,所以其實很多功能,不夠時間讓我們寫到夠完美夠好。於是對自己在開發任何元件時,都要設定 deadline。如果一定時間內(15 min' 30 min)寫不完,就要放棄,或者是改採其他 solution。

(3) 平常要有自己的 best practices

作網站的時候,我們知道很多工夫都是重複的。比如說作網站一定要有一個網頁主框架、一個 Facebook 登入系統、一個系統管理介面,一些常見的分享功能。

這些事情都小,但是堆起來還是很花時間。如果比賽時,這部分的時間成本若是 0,我們可以把更多的時間花在寫核心功能上。像我上禮拜釋出的一個 app 產生器 Bootstrappers

這個 Bootstrappers 其實就是我這次比賽時用的大砲,它可以讓你一鍵就產生一個網站雛形,然後馬上開始刻程式。所以當別人還在討論要作什麼時,我這部分已經作完了....

而我和夥伴已經一起工作將近三個月,彼此有不錯的默契。我們在寫 code 時,了解彼此寫 code 的習慣,於是接力對方的部分,速度就非常快。而我們更用了 git 這套程式碼版本控制系統,可以做到各寫各的,不會干擾。

12、如果 Facebook 邀請你們加入當員工,會進去嗎?

會慎重考慮。

 
over 4 years ago

Paerclip.io

Facebook visit

Hi, everyone. I am happy to announce the new service I recently built at 2012 Facebook World Hack Taipei : 「Paperclip.io」. Not only won the “Best Overall” prize in Taipei. We also win the Grand Prize of World Hack .

News here: World HACK Recap and Winners

====

We're pleased to announce the Grand Prize winners, whose projects stood out from the many high quality apps. These teams have won a trip to Facebook headquarters in Menlo Park, where they will meet with members of the Facebook engineering team:

The Paperclip.io team, from Taipei. Paperclip.io indexes and sorts the things you've liked on Facebook and across the web, so you can easily browse your likes by category or by the date you liked them.

The Chained Story team, from Buenos Aires. Chained Story is a web version of a storytelling game in which players take turns adding a sentence or paragraph to a story. The completed story can be published to a user's timeline.

The BoostMate team, from Moscow. BoostMate analyzes your social graph and the connections you have with all your friends, producing a ranking of who you're closest to, who you interact with least, and whether those interactions were positive.

====

各位好,前陣子在 Facbook World Hack 奪下台北站首獎的作品paperclip.io。我們很高興的宣布,這個服務再次奪下了 Grand Prize of World Hack 。獎品是前往 Facebook 總部一遊。

我們很高興能為台灣爭了一口氣!謝謝大家一路上的鼓勵!

新聞連結在此:World HACK Recap and Winners

 
over 4 years ago

Bootstrappers Demo

這是我本週剛釋出的一個 Gem: Bootstrappers。是一個 Rails 專案產生器,特色是內建馬上套好的 Bootstrap theme 和 其他好東西。

Bootstrappers 的開發緣由

身為一個職業開發者,我開啟一個新專案的機會實在太高了。但是,你知道的。每次要開發一個專案,無非就是 rails new project_name。然後打開 Gemfile,添加一些常用 Gem,再修改 application.html.erb,塞塞設定,填填 CSS,修修 HTML。

Bootstrap 以及其他 rubygems 是很方便,但是把他們組起來還是非常花時間。次數多了,我就覺得這樣的初始化動作實在很煩。

於是,我第一次的嘗試,就是作一個空專案,把我平常的 best practices 和 templates 都丟進去。如果有開新專案的需求,再 copy 過去。

但是,隨著時間更迭,我又發現更煩的事了。就是我還是得花上一堆時間改 namespace 與 setting。而且,裡面內建的 rubygems 會過期,等於還要花時間 ugprade 這些 template。而最煩的還是:Rails 本身自己也會過期!而要升級的小版本,自己可能還要補一堆 config,而這些變動真的很難追蹤。

於是,最後我下定決心要來研究 App Generator 到底要怎麼寫。我實在受夠了每次的 c/p + modify 了。

(之後我也許會寫一篇如何製作 App 產生器的文章 )

最後 Bootstrappers 就這樣誕生了。

內建好康

這個專案裡面目前內建了以下這些 Gem 以及相關 Template :

Powerful Features

特點如下

  • 現成套好的 Bootstrap Theme (application.html.erb)
  • 搭配的 Bootstrap Helper,快速兜出表單、選單、按鈕、Dropmenu、ajax modal、alert、breadcrumb 等等…
  • 套好的 WillPaginate (with bootstrap style)
  • 套好的 SimpleForm (with bootstrap style)
  • 內建 Devise 會員系統
  • Bootstrap useful hacks (比如 body { padding-top:60px }、dropmenu 自動展開等等)
  • Boostrap override best-practices
  • MagicEncoding : Ruby 1.9 自動添加 utf-8 宣告
  • 自動掛上 Compass
  • SeoHelper : 自動幫你的網站產生 page description / page keywords
  • Open Graph : 自動幫你的網站產生 og description / og_image
  • Facebook JS、Google Analytics
  • Capistrano / Cape
  • Asset Pipeline 加速器
  • ….etc.

一些我平常開發專案時,累積出來的 best practices。

有了這個武器,你現在可以使用 bootstrappers project_name 這個指令,一鍵瞬間就產生出一個不錯的 app,而不用擔心套版問題以及一些基本的網站優化問題。

歡迎 現在就試看看

Bug / Pull Request

https://github.com/xdite/bootstrappers/issues

歡迎各位回報錯誤,或者提交 Pull Request。當然,如果能夠直接提交 Pull Request,是最感謝的。

我還會繼續把一些還沒丟進去的 best practices 繼續整合進去。如果各位有興趣幫忙的話,歡迎查看 TODO.md。

https://github.com/xdite/bootstrappers/blob/master/TODO.md

 
over 4 years ago

在我的前一篇文章「Specification by Example - 團隊如何交付正確的軟體」,我提到了一件在工程師界,人人皆知卻不願意說出口的「秘密」:

「工程師竟然時常比他們的雇主或PM,更了解它的生意邏輯與流程」。
「客戶在它的 Spec 裡面卻指定了完全不可行或者是成本效益極低的作法」。因為簽了合約或領了老闆的薪水,我們被迫在明知不可而為之的狀況下,進行了一個徹底失敗的專案。」

如果你不是身處於工程師這個圈子的話,若無意中聽到這一件事,通常會覺得這群人相當傲慢。這群人不負責執行 Bussiness Development,怎都可大膽有此感想?

一開始,我也對這個「觀察」是存疑的。因為一開始時擁有這個觀察時,我還算是個很菜的工程師,這個觀察對我來說應該是錯覺。但隨著生涯中經歷過許多專案的角色。在專案中,我屢屢嘗試著尋找能夠反駁這個觀察的蛛絲馬跡。但最終都以失敗告終。

而後來更輾轉得知,這幾乎是這個圈子內「不能說出口的秘密」。我才同意這也是真的結論。只是我還是找不出 理論 / 反證。

直到最近,我才從幾段討論中,赫然領悟這件事情也許可能是有一套理論可以解釋的。

一段是從 @yllan (台灣知名 Cocoa 開發者,Nally 作者)在的 Facebook 的 post

====

Steve Jobs 說他很喜歡一個比喻。他以前在 Scientific American 上看到一篇文章,研究各種動物運動的效率,最強的是兀鷹(同樣的運動使用最少能量),人類排名普普通通,可能排在所有動物的三分之一左右。

有趣的是,那篇文章也研究了「騎著腳踏車」的人類,而騎腳踏車的人其能源效率把所有動物遠遠甩在後頭。人類製造工具大幅拓展自己的能力。而 SJ 把「電腦」比喻成「心靈的腳踏車」。

他又認為每個人都應該學程式,因為你在教電腦事情的時候,其實是在釐清自己的思考。這正和 Knuth 的名言「A person does not really understand something until after teaching it to a computer」不謀而合。

====

一段是我在跟與朋友的網路爭辯中,脫口而出寫出來的一段話(我常常從辯論驗證中,突然找到靈感,這些感想甚至是我自己也不知道為何會脫口而出的絕妙結論):

====

xdite : RD 會知道你的生意
xdite : 能不能成
xdite : 遠比你自己早知道
xdite : 因為他們會直接先面臨
xdite : 邏輯能不能實作
xdite : 我們會推測就是
xdite : 1. 合理
xdite : 2. 成本(要作多久)
xdite : 3. 效益
xdite : 剛好就是一個事業能不能做的基礎
xdite : 只是很多人誤以為
xdite : RD 只會 code .....
xdite : 3. 效益 就是...能不能重複用
xdite : 能不能實作 要作多久 可不可以重複利用
xdite : 都不可以 就會懷疑
xdite : 你是賺三小

====

我終於理解,為什麼 RD 會提早知道這個生意能不能成。這根本的原因就是因為他們便是嘗試教電腦事情的第一線人員。也就是會先面對「釐清」實作上「合不合理」的第一個人。

程式邏輯是非常現實的,若這件事不合理,RD 就會面臨「無法實作」的困境。這是其一。

其二:只有實作的人,才會知道這件事到底要作多久。RD 也許有樂觀病,往往他們告訴你需要實作兩週,但往往真實需要的時間也許是四週。但如果他們告訴你,需要半年這麼久,或者是根本作不出來,沒有完工的可能性。那可能這件事就不可能發生 -- 起碼在他們手上。

同時也應該要注意的是,這直接反應了成本的爆增。有時候,這甚至不是換一批執行團隊可以解決的問題。RD 正在試圖告訴你,執行代價高昂,你最好不要白花錢。因為很現實的,他也不想要白花時間…

其三:所有 RD 都非常討厭寫 event code。所謂 event code 就是只用過一次的 Code(因為某些特殊事件,如廣告、行銷活動,只執行過一次即扔的產品)。這類型的程式碼,往往無法被重新用在下一次的類似事件中,只能重新撰寫重新來過。這對任何重視自己心血結晶的人,重新來過是非常累人非常惱人的事。

而這對生意執行面來說,是非常高昂的沉沒成本。一再發生,甚至是不應被允許的行為。

小結

任何賺錢生意無非都是幾個簡單原則:首先,先觀察到一個合理需求。接著針對這個需求設計出一個可執行的解決方案。重複,證明解決方案可以被重製,可以得到收益。接著壓低執行成本,演化出一個可以獲利的模式。而在這段過程中:

  1. 合理實作
  2. 時間成本
  3. 重複效益

是至關重要的。

世上從來就不存在這麼一個假設:「覺得自己有一個偉大 idea,接著偉大的事情就會發生」

而在整個模式的發生過程,RD 正是日日夜夜都要面對這個挑戰的第一線執行者。

如果他們很坦白的告訴你這個想法很蠢,也許這件事就真的很蠢,你應該停下來聽他們怎麼說…

 
over 4 years ago

這個禮拜終於斷斷續續用了空檔時間讀完了一本買了卻一直沒時間坐下來好好研究的書「Specification by Example

對岸的圖靈系列最近也出了這本書的中文版:「實例化需求」。如果你想要觀看這本書的書評,InfoQ 上有一篇不錯的文章:「《實例化需求》採訪與書評」。

這本書給我一種很奇妙的讀後感,因為書中既沒有程式碼,也不介紹任何工具,甚至實際軟體例子也很少,篇幅最多的甚至是模糊的團隊訪談。

但讀完了以後,卻讓我在軟體開發上流程上有了更大的啟發。

交付錯誤的軟體的原因

我是一名職業的軟體開發者。前前後後寫過的軟體專案也有 50 個, 60 個。目前也以開發軟體為生。在我的職業生涯裡面,其實我有一個從來沒有跟人講過的秘密困擾。這個困擾,我相信許多同業們可能也有。那就是 --- 一個專案開發下來,「我們竟然時常比我們的客戶或 PM,更了解它的生意邏輯與流程」

但這個問題帶來更大的困擾是:「客戶在它的 Spec 裡面卻指定了完全不可行或者是成本效益極低的作法」。因為簽了合約或領了老闆的薪水,我們被迫在明知不可而為之的狀況下,進行了一個徹底失敗的專案。

技術很好,團隊也強大,產品也有市場。但還是失敗,因為 -- 「交付錯誤的軟體」。

軟體工程沒教的課題: 交付正確的軟體

市面上有很多書,教人如何敏捷開發,教人測試驅動開發(TDD)。它們可以帶給開發者的好處是可以利用這些技巧將工程時間大幅縮短,降低軟體內發生 Bug 的頻率。

這些技巧對於進行軟體專案不是沒有作用,因為早點完工(把功能實做出來),專案早點失敗,專案可以及早軸轉到較接近成功的方向。

對於正在營運中的公司,內部專案早點失敗,及早軸轉到較接近成功的方向。往往是可接受的。因為總體目標是儘快交付到貼近正確方向的軟體。

但對於目標是交付一個軟體的專案,「交付錯誤的軟體」卻往往是糾紛的起源。但卻也是一個千古難解的課題。對於業主來說,他付錢是希望得到一個「正確的軟體」。但於對於被委託的開發者也往往有苦難言,因為他們得到的指示是「按照業主精確的功能敘述去實作軟體」,「正確與否」不是他們的最終責任。而是否「正確」通常往往也得等到上線之後,客戶根據用戶實測反應才能得知(雖然開發者往往是開發階段就往往能猜測出是否失敗的那一群人)。但這從來也不在合約的責任之內。

而這本書也就是在探討這個課題:怎麼樣的軟體流程,才能交付正確的軟體。

大家沒想到的答案: BDD

這本書繞了很多遠路去講解什麼是 Specification by example,但這也是作者的用意:刻意不使用專業定義字眼如「敏捷」、「測試驅動開發」去輔助解釋,避免整個梳理的流程被大家腦海裡面的術語印象所綁架。

但總體來說,這個結論毫無疑問就是 Behavior Driven Development (BDD)。不過這個 BDD 卻跟我當初學到的 BDD ( from Cucumber ) 印象很不一樣。這也是為什麼這次會花上幾個小時謄下這篇心得。

裡面有幾段 quote 我很喜歡,實際擊中困擾的核心:摘錄如下:

「實現範圍(Implementation scope)含有對業務問題的解決方案或達成業務目標的手段。很多團隊在開始實現軟件之前(在此之前發生的一切往往被軟件開發團隊所忽略),期望客戶、產品負責人或商業用戶來確定工作的範圍。在商業用戶明確說明他們的需求後,軟建交付團隊就依此時現。這樣本應該會讓客戶滿意。但事實上,這正是構建產品開始出現問題的時候。

如果軟件交付團隊依賴客戶給出用戶故事、用例清單或其他相關信息,那麼他們其實是在讓客戶設計解決方案。但是商業用戶不是軟件設計師。如果我們讓客戶去界定範圍,那麼項目就無法從交付團隊已有的知識受益。這樣開發出來的軟件是客戶所要求的,卻不是他們真正想要的。

成功的團隊不會盲目的接受軟件需求,將其作為未知問題的解決方案,相反,他們會從目標中獲取範圍。他們以客戶的業務目標為起始,然後通過協作界定可以實現目標的範圍。團隊與商業用戶一起工作確定解決方案。商業用戶專注於所需功能希望達到的目的,以及他們期望由此帶來的價值,這樣有助於所有人了解所需的功能。然後團隊提議一個解決方案,這樣比商業用戶自己想出來的方案更實惠、更快,並且更容易交付或維護。」

「與我一起共事過的商業用戶和客戶,大多喜歡把需求描述成解決方案;他們很少會去討論想要達到的目標,或者亟待解決的問題具有什麼特殊性質。我見過太多的團隊有一種危險的誤解,他們認為客戶總是正確的,客戶要求的東西總是一成不變的。這導致很多團隊盲目的接受客戶建議的解決方案,然後竭盡全力去實現。」

「在構建正確軟件產品的過程中,確定範圍扮演著重要的角色。沒有正確的範圍,其餘的工作只是在作無用功。」

「人們告訴你他們自己認為需要什麼,通過問他們『為什麼』,你可以找到背後的目標。許多組織不能明確地指出他們的商業目標。然而,一旦你獲得了目標,就應該再反過來從已確定的目標上獲取範圍,可能你會丟棄掉原先假定出來的範圍」

一個實際的例子:對 VIP 免費送貨 的需求

Specification by example 強調的是對於需求,我們必須設計出一個可以被實現的方案,這個方案可以被單獨測試驗證。並且從這個方案與程式碼中演化出 LiveDocument。

書中舉出了一個實際的例子。(整理摘錄)

Untitled

商業目標

12 個月內對現有客戶提高 50% 的重複銷售

實作範圍

我們可以從商業目標中獲取實現範圍。實現團隊和商業投資者一起提出一些想法,然後把他們分成可交付的軟件塊。比方說我們發現一個主題故事是關於客戶忠誠度計畫的。這個故事可以分解成客戶忠誠度管理系統的基本功能和更高級的獎勵計畫。我們決定首先專注在建立一個基本的會員忠誠度管理系統上:客戶註冊一個 VIP 計畫,VIP 客戶有資格獲得特定物品的免費送貨。我們將推遲關於高級獎勵計畫的討論。下面這個例子的用戶故事:

  • 為了能對現有客戶作產品直銷,作為營銷經理,我想讓客戶通過加入 VIP 計畫註冊個人信息。
  • 為了吸引現有客戶註冊 VIP 計畫,作為營消經理,我要系統為 VIP 客戶提供特定物品的免費送貨。
  • 為了節省開支,作為現有客戶,我希望能收到特價優惠的信息。
關鍵實例

一旦團隊開始實現某個特定的功能,我們就可以為特定的範圍產生具體的需求說明。比如,當我們開始作範圍中的第二項 -- 免費送貨時 -- 必須定義好什麼是免費送貨。在協作討論過程中,為了避免運送電子產品或大件物品相關的後勤問題,我們決定系統只提供書籍的免費送貨服務。因為商業目標是提升重複銷售,我們嘗試讓客戶進行多次購買,「免費送貨」變成了「免費為 5 本或以上書籍送貨」。我們要確定好關鍵實例,比如 VIP 客戶購買 5 本圖書、VIP 客戶購買 5 本以下的圖書,或者非 VIP 客戶購買書籍。

接著討論當客戶同時購買了書籍和電子產品時該怎麼辦。有些人建議擴展範圍,例如,將訂單拆分成兩個,只為書籍提供免費送貨。我們決定推遲這個決定,先實現最簡單的。如果訂單中有非書籍的物品,我們就不提供免費送貨。我們加入下面這個新的關鍵實例,之後會再討論。

關鍵實例:免費送貨
  • VIP 客戶購物車中有 5 本書籍可以獲得免費送貨
  • VIP 客戶購物車中有 4 本書及就不提供免費送貨
  • 普通客戶購物車中有 5 本書籍沒有免費送貨
  • VIP 客戶購物車中有 5 台洗衣機時不提供免費送貨
  • VIP 客戶購物車中有 5 本書籍和 1 台洗衣機時不提供免費送貨
帶實例的需求說明

我們從關鍵實例中提煉出需求說明、創建出一目了然的文檔並將其格式化成便於今後作自動化驗證的格式(如下所示)

免費送貨
  • 當VIP 客戶購買一定數量的書籍時,提供免費送貨。免費送貨不提供給普通用戶或購買非書籍的 VIP 客戶。
  • 假定至少買 5 本書才能獲得免費送貨服務,那麼我們會得到以下預期:

Example:

客戶類型 購物車中的物品 送貨
VIP 5 本書 免費、標準
VIP 4 本書 標準
普通 10 本書 標準
VIP 5 台洗衣機 標準
VIP 5 本書、1台洗衣機 標準

這個需求說明 --- 一目了然的文檔 -- 可以用作實現的目標或自動化測試的驅動,這樣我們就可以客觀地衡量什麼時候算完成了。把它作為 LiveDocument 的一部分,保存在需求說明 Repository 中。FitNesse 的 wiki 系統或者 Cucumber 功能文件的目錄結構就是這樣的例子。

可執行的需求說明

當開發人員開始實現需求說明所描述的功能時,基於需求說明的測試開始時會失敗,因為測試還沒有自動化,功能也還沒有實現。

開發人員會實現相關功能並把它與自動化框架關聯在一起。他們使用自動化框架從需求說明中獲得輸入並驗證預期的輸出,而不需要實際修改需求說明文檔。當驗證實現自動化以後,需求說明就變成可執行的了。

Live Document

所有已實現功能的需求說明需要頻繁地進行驗證,一般通過自動化構建過程來實現。這樣可以確保需求說明保持更新,同時有助於避免功能退化的問題。

當實現了整個用戶故事的時候,需要有人去作首次驗證以確保其已經完成,然後重組需求說明確保它和已實現功能的需求說明是一致的。從需求說明逐步演化出文檔系統。舉例來說,他們可能將免費送貨的需求移到送貨相關的功能體系中,也可能將它們和其他因素促發的免費送貨實例合併在一起。為了更容易訪問文檔,他們可能會在免費送貨的需求說明和其他送貨類型的需求說明之間建立連結。

然後這個循環再次開始。一旦我們需要再次回顧免費送貨的規則 -- 比如,在做高級獎勵計畫,或是擴展功能把帶書籍的訂單和其他貨物訂單分離開的時候 -- 我們就可以使用 Live Document 來理解現有的功能並註明需要修改的地方。我們可以使用已有的實例來協作制定需求說明,同時舉例說明會更加有效。然後我們會舉出另一組關鍵實例,進一步演進免費送貨的需求說明,這部分最終會和需求說明的其他部分合併到一起。這個循環會不斷重複。

為何 BDD 沒有 TDD 那麼流行?

如果你身為 Rails Developer 又看到這套循環格式的話,你會馬上感到這跟一套測試框架很像,沒錯,就是 Cucumber

我第一次接觸到 BDD 的觀念大概是 2009 年。當然也是因為接觸到 Cucumber,才知道什麼叫做 BDD。但是一直以來,我能夠接受 TDD,但是 BDD 卻一直讓我無法理解。事實上,BDD 也一直沒有普遍流行起來

現在看完這本書,我才理解是什麼的盲點造成了實作上的心理障礙:在一般的專案開發中,通常業主不會要求開發者寫測試(甚至業主不理解什麼叫測試),所以通常測試是開發者自己寫的,為了正確構建功能,以及避免在專案後期踢到大鐵板,所寫的。

但是 BDD 的格式乍看之下卻相當突兀,以 Cucumber 為例,格式是這樣的:

  Scenario: Multiple Givens
    Given one thing
      And another thing
      And yet another thing
    When I open my eyes
    Then I see something
      But I don't see something else

敘述一個場景,然後寫下步驟,然後驗證步驟。這對一般開發者來說,BDD 相對多餘以及冗長。

原因何在?這是一般專案中,通常我們只會遇到兩種狀況:

  • 客戶疏於描述實作內容 : 只給解決方案,如必須要能夠進行付款。(但是卻沒有講清楚支援信用卡還是 ATM)

所以所謂 BDD 裡面的用戶故事,開發者必須要自行腦內補完。於是只要當「規格」一變,基於規格所生(想像)的整個用戶故事自然就會被摧毀。所以沒有人很喜歡寫這鬼東西。

  • 客戶過於精確的描述:對於描述操作步驟過於繁瑣,甚至是規定 UI (比如結帳必須要跳出一個 POP 視窗,等待信用卡驗證時必須要塞入一個等待過場動畫)

這又會變成另外一種情形,開發者把 BDD 當作是 UI 的驗收測試(尤其在使用 Cucumber 中特別容易被誤解)。在網站開發過程中,UI 很有可能是會變來變去的。沒有人會喜歡因為 UI 改變了然後又回去翻修用戶故事....

這就造成了為什麼人們寧願只進行 TDD,甚至只進行 Unit Test。因為比較不可能被需求變動整到。

但只進行 TDD 只能幫助我們:正確地開發一個產品。卻無法達到我們進行軟體開發最終的目標:「開發出一個正確的產品」。

Startup 前期應不應該導入 TDD / BDD?

在去年,我曾經寫過一篇 對 BDD / TDD 的看法,提到 Obie Fernandez 在 Rails Conf 2011 的 lightning talk 曾經給過這樣一個 lighting talk : Why BDD is Poison For Your Early Stage Startup 。並且在演講之後寫了一篇文章 The Dark Side Beckons?

Obie 的觀點正如 talk 名 "Why BDD is Poison For Your Early Stage Startup" 所言。他並且強調了:「Early on in the startup process, it's much more important to be testing against business metrics than anything having to do with code.」

「Until you are able to prove that you have a viable market, that customers will give you money for your product, you shouldn't be sinking a lot of time and money into implementation.」

現在回頭看起來,當時的討論完全是掉入方法論面的論述。我們以為 TDD / BDD 是「正確地開發一個產品」的一個手段。但這個手段會有相對高額的 technical cost。所以在 Startup 早期階段,開發者實際不應該投入過多心力在此之上。因為 Startup 的第一優先是「開發出一個正確的產品」。

而 Specification by example 卻強調的是,你應該透過這一系列的手段,利用 BDD 這樣的手法,摸索出一系列可以實作可以測試的正確軟體需求,從而交付出一個成功的軟體專案。

小結

如果你是抱著裡面有什麼厲害的大絕招,去翻這本書的話。我不敢保證你不會失望。因為這本書不太能算是一本嚴肅的方法論。裡面沒有 code,也不介紹任何工具。同時我也不推薦任何專案新手去翻閱這本書,因為這本書並不是什麼印度蛇藥,你一看完就會變成專案高手。

但是若你進行過不少專案,對於測試驅動開發、行為驅動開發、探索用戶需求有著自己的一番見解、疑問、心得。我相信這本書將會顛覆你的世界觀。

 
almost 5 years ago

Paerclip.io

Hi, everyone. I want to introduce the new service I recently built at 2012 Facebook World Hack Taipei : 「Paperclip.io」. It is also the "Best Overall" service in Facebook World Hack Taipei.

What is Paperclip.io?

Paperclip.io tracks and collects webpages you liked via Facebook, and organizes them for you. You can browse or search through the liked pages quickly in Paperclip.io.

idea from …

The idea was from a small thing: I always forget what url I ever liked on Facebook. It was really annoying. So finally I decide to build a service to help me to collect and organize this url links.

Features

  • automatic tracking and backup
  • organized by various types, provides url info and snapshots.
  • can reshare to google plus+, twitter, del.icio.us…etc
  • searchable!!

demo video

video creditd by htchien

like us on Facebook:

https://www.facebook.com/paperclip.io

======

各位好。這是我昨天才剛推出的新服務「paperclip.io」。這個服務的主旨是要解決一個困擾:我們每天在 Facebook 上都會「讚」過很多網址。但是,就是因為「讚」過的東西太多了,每次要回去找今天或前幾天讚過什麼東西,都很麻煩。

所以最後我決定寫了一個服務來解這樣的困擾,它可以:

  • 每天自動備份你曾經「讚」過什麼
  • 按照 og:type 分類排好,而且有縮圖、大綱,
  • 還可以讓你容易再度的分享到其他服務(如 Google+, twitter)去。
  • 最棒的是可以搜尋!!也就是可以快速搜尋你曾經到底「讚」過什麼鬼了!

螢幕快照 2012-09-11 下午7.10.01

看了 demo 影片就知道!

這個服務也讓 我跟夥伴 zhusee 同時奪得了 2012 Facebook World Hack 台北站的首獎 (Best Overall)

歡迎各位試用!

如果使用上有什麼 bug 的話,請在這篇文章底下留言。我會儘快處理…

P.S. 因為機器小台,而且光今天用戶就瞬間爆增幾百個...,所以有可能你剛剛匯入的東西有可能不會那麼快跑出來,這目前不是 bug…還請見諒。

 
almost 5 years ago

我 9/12 - 9/20 會在舊金山。參加 9/14, 9/15 的 Golden Gate Ruby Conf

如果有灣區的讀者想晚上吃個飯小酌,歡迎寫信給我 :D (xdite AT rocodev.com)

P.S. 我住 San Francisco 的 Mission District

 
almost 5 years ago

這是前陣子在 LoneStarRubyConf 2012 上複習一些主題時,無意中翻到的一份宣言。

這份宣言我是從 Heroku 的工程師 Richard Schneeman 發表的這份 talk :Millions of Apps Deployed: What We've Learned 裡面翻到的。(不是很多人關注到。這份投影片我看到時才 100 Views 左右)

這篇投影片相當精彩,內容是從一份宣言 12factor.net 出發。列舉了十二項構建 Service as Service 所需的方法主題,再以如何使用 Rails 及其 Ecosystem 搭建出 Twelve-Factor App 宣言裡的需求條件為主旨展開。

因為這份投影片的內容,其實我在兩三年前就想寫過系列文章,但因為是一份相當宏大且沒有邊界(就當時來看)的主題,因此一直遲遲無法完成。社群內有人能夠整理出來,覺得實在太棒了。

不過我更好奇的是,若這能是一份非 Rails 為主軸的內容,影響層面應可以更大。念頭剛起,我就發現投影片的源頭出處 12factor.net 的這份宣言原本就是 language-agnostic based 的。

這麼宏大的主題,若是一個社群阿貓阿狗所寫,想必沒有說服力。但順著線索摸下去,我更發現 The Twelve-Factor App 這份宣言的起草人不是別人,正是 Heroku 的 Founder: Adam Wiggins。宣言的內容是他基於運營 Heroku 以來,公司經手過數十萬 Application 歸納出的結論。

這份宣言在前陣子已有人翻成簡體中文版 The Twelve-Factor App,我推薦各位絕對要去讀完...


(以下轉錄中文簡介,並對用語酌量修改)

簡介

如今,軟體通常會作為一種服務來交付,它們被稱為網路應用程式,或「軟體即服務」(SaaS)。「十二因子應用程式」(12-Factor App)為構建如下的SaaS應用提供了方法論:

使用標準化流程自動配置,從而使新的開發者花費最少的學習成本加入這個項目;
和操作系統之間盡可能的劃清界限,在各個系統中提供最大的可移植性;
適合部署在現代的雲計算平台,從而在服務器和系統管理方面節省資源;
將開發環境和生產環境的差異降至最低,並使用持續交付實施敏捷開發;
可以在工具、架構和開發流程不發生明顯變化的前提下實現擴展;
這套理論適用於任意語言和後端服務(資料庫、Message Queue、Cache等)開發的應用程式。

背景

本文的貢獻者者參與過數以百計的應用程式的開發和部署,並通過Heroku平台間接見證了數十萬應用程式的開發,運作以及擴展的過程。

本文綜合了我們關於SaaS應用幾乎所有的經驗和智慧,是開發此類應用的理想實踐標準,並特別關注於應用程式如何保持良性成長,開發者之間如何進行有效的代碼協作,以及如何避免軟件污染。

我們的初衷是分享在現代軟體開發過程中發現的一些系統性問題,並加深對這些問題的認識。我們提供了討論這些問題時所需的共享詞彙,同時使用相關術語給出一套針對這些問題的廣義解決方案。本文格式的靈感來自於 Martin Fowler的書籍:Patterns of Enterprise Application ArchitectureRefactoring

讀者應該是哪些人?

任何SaaS應用的開發人員。部署和管理此類應用的運維工程師。

The Twelve Factors
I. Codebase

One codebase tracked in revision control, many deploys

II. Dependencies

Explicitly declare and isolate dependencies

III. Config

Store config in the environment

IV. Backing Services

Treat backing services as attached resources

V. Build, release, run

Strictly separate build and run stages

VI. Processes

Execute the app as one or more stateless processes

VII. Port binding

Export services via port binding

VIII. Concurrency

Scale out via the process model

IX. Disposability

Maximize robustness with fast startup and graceful shutdown

X. Dev/prod parity

Keep development, staging, and production as similar as possible

XI. Logs

Treat logs as event streams

XII. Admin processes

Run admin/management tasks as one-off processes

 
almost 5 years ago

Russian Dolls 097

大概半個月之前(2012/ 8/13 前後),@dhh 釋出了一個有關於 cache 的 gem,叫做 cache_digests,並宣布此 gem 會成為 Rails 4 中的一部分。

既然會是主體的一部分,想必這個 gem 解決的問題非常重要。但無奈 README 也非常簡略,看不出重要性在哪。還花了我一點時間在網路上找資料,把 DHH 想要表達的哲學拼出來....

從 new Basecamp 改版談起

@dhh 的公司 37signals 旗下最有名的產品 Basecamp 大概半年前改版了。與其說是改版,不如說是整個大重寫了。撇開使用性不談(好用度大幅提高),Website Performance 整體也大幅提升。

37signals 在大概二月發表了一篇文章,談了這次的版本為什麼效能變得這麼好:

1. Turn to JavaScript Applicaton

眾所皆知(?)的這次的改寫重點是在 JavaScript 上,整個 codebase 中CoffeScript 與 Ruby 的比例到達了 1:1 之譜。也就是 new Basecamp 實質上是個「JavaScript Application」。另外再利用 Stacker (advanced puhState-based engine for sheets) 大幅降低 HTTP requests。

2. Cache TO THE MAX: Russian Doll cache stratgy

雖然 new Basecamp 已經是個 「JavaScript Application」。但有個問題還是存在,身為 backend 的 Rails App 在 render Basecamp 的邏輯時,速度還是不夠快。於是他們採用「Russian Doll」的 Cache Strategy 把能 Cache 的部分擴展到上限…

Russian Doll cache strategy

如名所示,Russian Doll strategy,就是使用層層 cache 嵌套的策略。

這一張圖片的背後 code 會是這樣的寫法:

<% cache @project do %>
  aaa
  <% cache @todo do %>
    bbb
    <% cache @todolist do %>
      ccc
    <% end %>
  <% end %>
<% end %>

再利用 Rails 內建 cache helper 使用 "#{cache_key}/#{id}-#{timestamp}" (出處) 的方式去實作 cache invalidation。如此一來,只要 object 被變更,cache 就會被刷新。

但這招即使如此直觀,還是會遇到 invalidation 上的幾個問題。

1. 更新了 todolist,但是上層 class: todo 卻不知道…

todlist 更新了,所以 updated_at 會被更新。不過 todo 卻不知道 todolist 的更新,所以整塊並不會被更新。

解法:

不過解法容易。可以透過 belongs_to :todo, :touch => truebelongs_to :product, :touch => true。從最底部的 todolist,層層連鎖更新到最上層。

2. 更新了 code block,但 object 內容卻因為沒更新而不會 expire。

當我把 ccc 改成 zzz 時且打算 deploy 時,問題來了...。整套 cache 機制是基於 object 更新,而不是 code 更新。所以 cache 並不會 invalid….

<% cache @project do %>
  aaa
  <% cache @todo do %>
    bbb
    <% cache @todolist do %>
      zzz
    <% end %>
  <% end %>
<% end %>
解法:

這邊有另外一個寫法可以閃過這個地雷,就是為這整段 code 加上版本號:

<% cache [v15,@project] do %>
  aaa
  <% cache [v10,@todo] do %>
    bbb
    <% cache [v45,@todolist] do %>
      zzz
    <% end %>
  <% end %>
<% end %>

如果我要將 todolist block 那塊更新,要強制 invalid,我可以把 v45 改成 v46。這樣就更新了。

不過如果這一塊 view 上面還有外層 cache 嵌套,v10 要跟著變成 v11v15 要跟著變成 v16

有點麻煩了…

但這還不是最糟糕的…

3. cache 的部分散落在 partial 裡面,版本號更新不易

改版本號麻煩但還算可以接受。但這只限於都在同一張 view 裡面的狀況。

若是 cache 被放在 partial 裡面,被多個 view 引用呼叫,那就麻煩了…

_todolist.html.erb

<% cache [v45,@todolist] do %>
  zzz
<% end %>

改版本號的手續就變成地獄了…。因為你永遠都會有忘記清掉的 view…

解法:

暫無。認命的改吧(?)

4. 逐漸冗長的 syntax 問題..

而使用版本號閃避 cache 還會造成,原本直觀的

  <% cache @todolist do %>
    zzz
  <% end %>

為了要 invalid cache 的問題,被迫使用 trick 去 bypass。

  <% cache [v45,@todolist] do %>
    zzz
  <% end %>

可不可以單純一點,我們寫 code 還是回到直觀的 cache @object,然後以上談到的這些問題都會自動解決?

cache_digests 就是這一切的答案:md5_of_this_view

cache_digests 就是 DHH 解決這一切惱人問題的手段。

而且解決策略也非常簡單,既然大家都在版本號上面 GGYY,那麼其實最快的方式就是 md5_of_this_view !!!

cache_digests 允許開發者繼續使用這樣的 code:

  <% cache @todolist do %>
    zzz
  <% end %>

但!cache_digests 自動幫忙計算此 block 裡面的 code 產出的內容的 md5,以此 md5 作為 cache key,從而達到自動 invalid 的效果。

同時,這個 gem 也會自動解決層層嵌套的 dependency 問題…

小結

這一個 gem 前前後後不到 150 行。卻解決了一個非常重要的 cache 問題,也難怪會變成 Rails 4 之後內建的功能。

gem 雖然直觀。不過翻出這些前因後果還真是不簡單,在寫這篇文章的確也花了我花了一點時間去蒐集資料。從 37signals 釋出的一些小片段去把內容組出來。

相關連結: