about 5 years ago

這個禮拜終於斷斷續續用了空檔時間讀完了一本買了卻一直沒時間坐下來好好研究的書「Specification by Example

對岸的圖靈系列最近也出了這本書的中文版:「實例化需求」。如果你想要觀看這本書的書評,InfoQ 上有一篇不錯的文章:「《實例化需求》採訪與書評」。

這本書給我一種很奇妙的讀後感,因為書中既沒有程式碼,也不介紹任何工具,甚至實際軟體例子也很少,篇幅最多的甚至是模糊的團隊訪談。

但讀完了以後,卻讓我在軟體開發上流程上有了更大的啟發。

交付錯誤的軟體的原因

我是一名職業的軟體開發者。前前後後寫過的軟體專案也有 50 個, 60 個。目前也以開發軟體為生。在我的職業生涯裡面,其實我有一個從來沒有跟人講過的秘密困擾。這個困擾,我相信許多同業們可能也有。那就是 --- 一個專案開發下來,「我們竟然時常比我們的客戶或 PM,更了解它的生意邏輯與流程」

但這個問題帶來更大的困擾是:「客戶在它的 Spec 裡面卻指定了完全不可行或者是成本效益極低的作法」。因為簽了合約或領了老闆的薪水,我們被迫在明知不可而為之的狀況下,進行了一個徹底失敗的專案。

技術很好,團隊也強大,產品也有市場。但還是失敗,因為 -- 「交付錯誤的軟體」。

軟體工程沒教的課題: 交付正確的軟體

市面上有很多書,教人如何敏捷開發,教人測試驅動開發(TDD)。它們可以帶給開發者的好處是可以利用這些技巧將工程時間大幅縮短,降低軟體內發生 Bug 的頻率。

這些技巧對於進行軟體專案不是沒有作用,因為早點完工(把功能實做出來),專案早點失敗,專案可以及早軸轉到較接近成功的方向。

對於正在營運中的公司,內部專案早點失敗,及早軸轉到較接近成功的方向。往往是可接受的。因為總體目標是儘快交付到貼近正確方向的軟體。

但對於目標是交付一個軟體的專案,「交付錯誤的軟體」卻往往是糾紛的起源。但卻也是一個千古難解的課題。對於業主來說,他付錢是希望得到一個「正確的軟體」。但於對於被委託的開發者也往往有苦難言,因為他們得到的指示是「按照業主精確的功能敘述去實作軟體」,「正確與否」不是他們的最終責任。而是否「正確」通常往往也得等到上線之後,客戶根據用戶實測反應才能得知(雖然開發者往往是開發階段就往往能猜測出是否失敗的那一群人)。但這從來也不在合約的責任之內。

而這本書也就是在探討這個課題:怎麼樣的軟體流程,才能交付正確的軟體。

大家沒想到的答案: BDD

這本書繞了很多遠路去講解什麼是 Specification by example,但這也是作者的用意:刻意不使用專業定義字眼如「敏捷」、「測試驅動開發」去輔助解釋,避免整個梳理的流程被大家腦海裡面的術語印象所綁架。

但總體來說,這個結論毫無疑問就是 Behavior Driven Development (BDD)。不過這個 BDD 卻跟我當初學到的 BDD ( from Cucumber ) 印象很不一樣。這也是為什麼這次會花上幾個小時謄下這篇心得。

裡面有幾段 quote 我很喜歡,實際擊中困擾的核心:摘錄如下:

「實現範圍(Implementation scope)含有對業務問題的解決方案或達成業務目標的手段。很多團隊在開始實現軟件之前(在此之前發生的一切往往被軟件開發團隊所忽略),期望客戶、產品負責人或商業用戶來確定工作的範圍。在商業用戶明確說明他們的需求後,軟建交付團隊就依此時現。這樣本應該會讓客戶滿意。但事實上,這正是構建產品開始出現問題的時候。

如果軟件交付團隊依賴客戶給出用戶故事、用例清單或其他相關信息,那麼他們其實是在讓客戶設計解決方案。但是商業用戶不是軟件設計師。如果我們讓客戶去界定範圍,那麼項目就無法從交付團隊已有的知識受益。這樣開發出來的軟件是客戶所要求的,卻不是他們真正想要的。

成功的團隊不會盲目的接受軟件需求,將其作為未知問題的解決方案,相反,他們會從目標中獲取範圍。他們以客戶的業務目標為起始,然後通過協作界定可以實現目標的範圍。團隊與商業用戶一起工作確定解決方案。商業用戶專注於所需功能希望達到的目的,以及他們期望由此帶來的價值,這樣有助於所有人了解所需的功能。然後團隊提議一個解決方案,這樣比商業用戶自己想出來的方案更實惠、更快,並且更容易交付或維護。」

「與我一起共事過的商業用戶和客戶,大多喜歡把需求描述成解決方案;他們很少會去討論想要達到的目標,或者亟待解決的問題具有什麼特殊性質。我見過太多的團隊有一種危險的誤解,他們認為客戶總是正確的,客戶要求的東西總是一成不變的。這導致很多團隊盲目的接受客戶建議的解決方案,然後竭盡全力去實現。」

「在構建正確軟件產品的過程中,確定範圍扮演著重要的角色。沒有正確的範圍,其餘的工作只是在作無用功。」

「人們告訴你他們自己認為需要什麼,通過問他們『為什麼』,你可以找到背後的目標。許多組織不能明確地指出他們的商業目標。然而,一旦你獲得了目標,就應該再反過來從已確定的目標上獲取範圍,可能你會丟棄掉原先假定出來的範圍」

一個實際的例子:對 VIP 免費送貨 的需求

Specification by example 強調的是對於需求,我們必須設計出一個可以被實現的方案,這個方案可以被單獨測試驗證。並且從這個方案與程式碼中演化出 LiveDocument。

書中舉出了一個實際的例子。(整理摘錄)

Untitled

商業目標

12 個月內對現有客戶提高 50% 的重複銷售

實作範圍

我們可以從商業目標中獲取實現範圍。實現團隊和商業投資者一起提出一些想法,然後把他們分成可交付的軟件塊。比方說我們發現一個主題故事是關於客戶忠誠度計畫的。這個故事可以分解成客戶忠誠度管理系統的基本功能和更高級的獎勵計畫。我們決定首先專注在建立一個基本的會員忠誠度管理系統上:客戶註冊一個 VIP 計畫,VIP 客戶有資格獲得特定物品的免費送貨。我們將推遲關於高級獎勵計畫的討論。下面這個例子的用戶故事:

  • 為了能對現有客戶作產品直銷,作為營銷經理,我想讓客戶通過加入 VIP 計畫註冊個人信息。
  • 為了吸引現有客戶註冊 VIP 計畫,作為營消經理,我要系統為 VIP 客戶提供特定物品的免費送貨。
  • 為了節省開支,作為現有客戶,我希望能收到特價優惠的信息。
關鍵實例

一旦團隊開始實現某個特定的功能,我們就可以為特定的範圍產生具體的需求說明。比如,當我們開始作範圍中的第二項 -- 免費送貨時 -- 必須定義好什麼是免費送貨。在協作討論過程中,為了避免運送電子產品或大件物品相關的後勤問題,我們決定系統只提供書籍的免費送貨服務。因為商業目標是提升重複銷售,我們嘗試讓客戶進行多次購買,「免費送貨」變成了「免費為 5 本或以上書籍送貨」。我們要確定好關鍵實例,比如 VIP 客戶購買 5 本圖書、VIP 客戶購買 5 本以下的圖書,或者非 VIP 客戶購買書籍。

接著討論當客戶同時購買了書籍和電子產品時該怎麼辦。有些人建議擴展範圍,例如,將訂單拆分成兩個,只為書籍提供免費送貨。我們決定推遲這個決定,先實現最簡單的。如果訂單中有非書籍的物品,我們就不提供免費送貨。我們加入下面這個新的關鍵實例,之後會再討論。

關鍵實例:免費送貨
  • VIP 客戶購物車中有 5 本書籍可以獲得免費送貨
  • VIP 客戶購物車中有 4 本書及就不提供免費送貨
  • 普通客戶購物車中有 5 本書籍沒有免費送貨
  • VIP 客戶購物車中有 5 台洗衣機時不提供免費送貨
  • VIP 客戶購物車中有 5 本書籍和 1 台洗衣機時不提供免費送貨
帶實例的需求說明

我們從關鍵實例中提煉出需求說明、創建出一目了然的文檔並將其格式化成便於今後作自動化驗證的格式(如下所示)

免費送貨
  • 當VIP 客戶購買一定數量的書籍時,提供免費送貨。免費送貨不提供給普通用戶或購買非書籍的 VIP 客戶。
  • 假定至少買 5 本書才能獲得免費送貨服務,那麼我們會得到以下預期:

Example:

客戶類型 購物車中的物品 送貨
VIP 5 本書 免費、標準
VIP 4 本書 標準
普通 10 本書 標準
VIP 5 台洗衣機 標準
VIP 5 本書、1台洗衣機 標準

這個需求說明 --- 一目了然的文檔 -- 可以用作實現的目標或自動化測試的驅動,這樣我們就可以客觀地衡量什麼時候算完成了。把它作為 LiveDocument 的一部分,保存在需求說明 Repository 中。FitNesse 的 wiki 系統或者 Cucumber 功能文件的目錄結構就是這樣的例子。

可執行的需求說明

當開發人員開始實現需求說明所描述的功能時,基於需求說明的測試開始時會失敗,因為測試還沒有自動化,功能也還沒有實現。

開發人員會實現相關功能並把它與自動化框架關聯在一起。他們使用自動化框架從需求說明中獲得輸入並驗證預期的輸出,而不需要實際修改需求說明文檔。當驗證實現自動化以後,需求說明就變成可執行的了。

Live Document

所有已實現功能的需求說明需要頻繁地進行驗證,一般通過自動化構建過程來實現。這樣可以確保需求說明保持更新,同時有助於避免功能退化的問題。

當實現了整個用戶故事的時候,需要有人去作首次驗證以確保其已經完成,然後重組需求說明確保它和已實現功能的需求說明是一致的。從需求說明逐步演化出文檔系統。舉例來說,他們可能將免費送貨的需求移到送貨相關的功能體系中,也可能將它們和其他因素促發的免費送貨實例合併在一起。為了更容易訪問文檔,他們可能會在免費送貨的需求說明和其他送貨類型的需求說明之間建立連結。

然後這個循環再次開始。一旦我們需要再次回顧免費送貨的規則 -- 比如,在做高級獎勵計畫,或是擴展功能把帶書籍的訂單和其他貨物訂單分離開的時候 -- 我們就可以使用 Live Document 來理解現有的功能並註明需要修改的地方。我們可以使用已有的實例來協作制定需求說明,同時舉例說明會更加有效。然後我們會舉出另一組關鍵實例,進一步演進免費送貨的需求說明,這部分最終會和需求說明的其他部分合併到一起。這個循環會不斷重複。

為何 BDD 沒有 TDD 那麼流行?

如果你身為 Rails Developer 又看到這套循環格式的話,你會馬上感到這跟一套測試框架很像,沒錯,就是 Cucumber

我第一次接觸到 BDD 的觀念大概是 2009 年。當然也是因為接觸到 Cucumber,才知道什麼叫做 BDD。但是一直以來,我能夠接受 TDD,但是 BDD 卻一直讓我無法理解。事實上,BDD 也一直沒有普遍流行起來

現在看完這本書,我才理解是什麼的盲點造成了實作上的心理障礙:在一般的專案開發中,通常業主不會要求開發者寫測試(甚至業主不理解什麼叫測試),所以通常測試是開發者自己寫的,為了正確構建功能,以及避免在專案後期踢到大鐵板,所寫的。

但是 BDD 的格式乍看之下卻相當突兀,以 Cucumber 為例,格式是這樣的:

  Scenario: Multiple Givens
    Given one thing
      And another thing
      And yet another thing
    When I open my eyes
    Then I see something
      But I don't see something else

敘述一個場景,然後寫下步驟,然後驗證步驟。這對一般開發者來說,BDD 相對多餘以及冗長。

原因何在?這是一般專案中,通常我們只會遇到兩種狀況:

  • 客戶疏於描述實作內容 : 只給解決方案,如必須要能夠進行付款。(但是卻沒有講清楚支援信用卡還是 ATM)

所以所謂 BDD 裡面的用戶故事,開發者必須要自行腦內補完。於是只要當「規格」一變,基於規格所生(想像)的整個用戶故事自然就會被摧毀。所以沒有人很喜歡寫這鬼東西。

  • 客戶過於精確的描述:對於描述操作步驟過於繁瑣,甚至是規定 UI (比如結帳必須要跳出一個 POP 視窗,等待信用卡驗證時必須要塞入一個等待過場動畫)

這又會變成另外一種情形,開發者把 BDD 當作是 UI 的驗收測試(尤其在使用 Cucumber 中特別容易被誤解)。在網站開發過程中,UI 很有可能是會變來變去的。沒有人會喜歡因為 UI 改變了然後又回去翻修用戶故事....

這就造成了為什麼人們寧願只進行 TDD,甚至只進行 Unit Test。因為比較不可能被需求變動整到。

但只進行 TDD 只能幫助我們:正確地開發一個產品。卻無法達到我們進行軟體開發最終的目標:「開發出一個正確的產品」。

Startup 前期應不應該導入 TDD / BDD?

在去年,我曾經寫過一篇 對 BDD / TDD 的看法,提到 Obie Fernandez 在 Rails Conf 2011 的 lightning talk 曾經給過這樣一個 lighting talk : Why BDD is Poison For Your Early Stage Startup 。並且在演講之後寫了一篇文章 The Dark Side Beckons?

Obie 的觀點正如 talk 名 "Why BDD is Poison For Your Early Stage Startup" 所言。他並且強調了:「Early on in the startup process, it's much more important to be testing against business metrics than anything having to do with code.」

「Until you are able to prove that you have a viable market, that customers will give you money for your product, you shouldn't be sinking a lot of time and money into implementation.」

現在回頭看起來,當時的討論完全是掉入方法論面的論述。我們以為 TDD / BDD 是「正確地開發一個產品」的一個手段。但這個手段會有相對高額的 technical cost。所以在 Startup 早期階段,開發者實際不應該投入過多心力在此之上。因為 Startup 的第一優先是「開發出一個正確的產品」。

而 Specification by example 卻強調的是,你應該透過這一系列的手段,利用 BDD 這樣的手法,摸索出一系列可以實作可以測試的正確軟體需求,從而交付出一個成功的軟體專案。

小結

如果你是抱著裡面有什麼厲害的大絕招,去翻這本書的話。我不敢保證你不會失望。因為這本書不太能算是一本嚴肅的方法論。裡面沒有 code,也不介紹任何工具。同時我也不推薦任何專案新手去翻閱這本書,因為這本書並不是什麼印度蛇藥,你一看完就會變成專案高手。

但是若你進行過不少專案,對於測試驅動開發、行為驅動開發、探索用戶需求有著自己的一番見解、疑問、心得。我相信這本書將會顛覆你的世界觀。

 
about 5 years ago

Paerclip.io

Hi, everyone. I want to introduce the new service I recently built at 2012 Facebook World Hack Taipei : 「Paperclip.io」. It is also the "Best Overall" service in Facebook World Hack Taipei.

What is Paperclip.io?

Paperclip.io tracks and collects webpages you liked via Facebook, and organizes them for you. You can browse or search through the liked pages quickly in Paperclip.io.

idea from …

The idea was from a small thing: I always forget what url I ever liked on Facebook. It was really annoying. So finally I decide to build a service to help me to collect and organize this url links.

Features

  • automatic tracking and backup
  • organized by various types, provides url info and snapshots.
  • can reshare to google plus+, twitter, del.icio.us…etc
  • searchable!!

demo video

video creditd by htchien

like us on Facebook:

https://www.facebook.com/paperclip.io

======

各位好。這是我昨天才剛推出的新服務「paperclip.io」。這個服務的主旨是要解決一個困擾:我們每天在 Facebook 上都會「讚」過很多網址。但是,就是因為「讚」過的東西太多了,每次要回去找今天或前幾天讚過什麼東西,都很麻煩。

所以最後我決定寫了一個服務來解這樣的困擾,它可以:

  • 每天自動備份你曾經「讚」過什麼
  • 按照 og:type 分類排好,而且有縮圖、大綱,
  • 還可以讓你容易再度的分享到其他服務(如 Google+, twitter)去。
  • 最棒的是可以搜尋!!也就是可以快速搜尋你曾經到底「讚」過什麼鬼了!

螢幕快照 2012-09-11 下午7.10.01

看了 demo 影片就知道!

這個服務也讓 我跟夥伴 zhusee 同時奪得了 2012 Facebook World Hack 台北站的首獎 (Best Overall)

歡迎各位試用!

如果使用上有什麼 bug 的話,請在這篇文章底下留言。我會儘快處理…

P.S. 因為機器小台,而且光今天用戶就瞬間爆增幾百個...,所以有可能你剛剛匯入的東西有可能不會那麼快跑出來,這目前不是 bug…還請見諒。

 
about 5 years ago

我 9/12 - 9/20 會在舊金山。參加 9/14, 9/15 的 Golden Gate Ruby Conf

如果有灣區的讀者想晚上吃個飯小酌,歡迎寫信給我 :D (xdite AT rocodev.com)

P.S. 我住 San Francisco 的 Mission District

 
about 5 years ago

這是前陣子在 LoneStarRubyConf 2012 上複習一些主題時,無意中翻到的一份宣言。

這份宣言我是從 Heroku 的工程師 Richard Schneeman 發表的這份 talk :Millions of Apps Deployed: What We've Learned 裡面翻到的。(不是很多人關注到。這份投影片我看到時才 100 Views 左右)

這篇投影片相當精彩,內容是從一份宣言 12factor.net 出發。列舉了十二項構建 Service as Service 所需的方法主題,再以如何使用 Rails 及其 Ecosystem 搭建出 Twelve-Factor App 宣言裡的需求條件為主旨展開。

因為這份投影片的內容,其實我在兩三年前就想寫過系列文章,但因為是一份相當宏大且沒有邊界(就當時來看)的主題,因此一直遲遲無法完成。社群內有人能夠整理出來,覺得實在太棒了。

不過我更好奇的是,若這能是一份非 Rails 為主軸的內容,影響層面應可以更大。念頭剛起,我就發現投影片的源頭出處 12factor.net 的這份宣言原本就是 language-agnostic based 的。

這麼宏大的主題,若是一個社群阿貓阿狗所寫,想必沒有說服力。但順著線索摸下去,我更發現 The Twelve-Factor App 這份宣言的起草人不是別人,正是 Heroku 的 Founder: Adam Wiggins。宣言的內容是他基於運營 Heroku 以來,公司經手過數十萬 Application 歸納出的結論。

這份宣言在前陣子已有人翻成簡體中文版 The Twelve-Factor App,我推薦各位絕對要去讀完...


(以下轉錄中文簡介,並對用語酌量修改)

簡介

如今,軟體通常會作為一種服務來交付,它們被稱為網路應用程式,或「軟體即服務」(SaaS)。「十二因子應用程式」(12-Factor App)為構建如下的SaaS應用提供了方法論:

使用標準化流程自動配置,從而使新的開發者花費最少的學習成本加入這個項目;
和操作系統之間盡可能的劃清界限,在各個系統中提供最大的可移植性;
適合部署在現代的雲計算平台,從而在服務器和系統管理方面節省資源;
將開發環境和生產環境的差異降至最低,並使用持續交付實施敏捷開發;
可以在工具、架構和開發流程不發生明顯變化的前提下實現擴展;
這套理論適用於任意語言和後端服務(資料庫、Message Queue、Cache等)開發的應用程式。

背景

本文的貢獻者者參與過數以百計的應用程式的開發和部署,並通過Heroku平台間接見證了數十萬應用程式的開發,運作以及擴展的過程。

本文綜合了我們關於SaaS應用幾乎所有的經驗和智慧,是開發此類應用的理想實踐標準,並特別關注於應用程式如何保持良性成長,開發者之間如何進行有效的代碼協作,以及如何避免軟件污染。

我們的初衷是分享在現代軟體開發過程中發現的一些系統性問題,並加深對這些問題的認識。我們提供了討論這些問題時所需的共享詞彙,同時使用相關術語給出一套針對這些問題的廣義解決方案。本文格式的靈感來自於 Martin Fowler的書籍:Patterns of Enterprise Application ArchitectureRefactoring

讀者應該是哪些人?

任何SaaS應用的開發人員。部署和管理此類應用的運維工程師。

The Twelve Factors
I. Codebase

One codebase tracked in revision control, many deploys

II. Dependencies

Explicitly declare and isolate dependencies

III. Config

Store config in the environment

IV. Backing Services

Treat backing services as attached resources

V. Build, release, run

Strictly separate build and run stages

VI. Processes

Execute the app as one or more stateless processes

VII. Port binding

Export services via port binding

VIII. Concurrency

Scale out via the process model

IX. Disposability

Maximize robustness with fast startup and graceful shutdown

X. Dev/prod parity

Keep development, staging, and production as similar as possible

XI. Logs

Treat logs as event streams

XII. Admin processes

Run admin/management tasks as one-off processes

 
about 5 years ago

Russian Dolls 097

大概半個月之前(2012/ 8/13 前後),@dhh 釋出了一個有關於 cache 的 gem,叫做 cache_digests,並宣布此 gem 會成為 Rails 4 中的一部分。

既然會是主體的一部分,想必這個 gem 解決的問題非常重要。但無奈 README 也非常簡略,看不出重要性在哪。還花了我一點時間在網路上找資料,把 DHH 想要表達的哲學拼出來....

從 new Basecamp 改版談起

@dhh 的公司 37signals 旗下最有名的產品 Basecamp 大概半年前改版了。與其說是改版,不如說是整個大重寫了。撇開使用性不談(好用度大幅提高),Website Performance 整體也大幅提升。

37signals 在大概二月發表了一篇文章,談了這次的版本為什麼效能變得這麼好:

1. Turn to JavaScript Applicaton

眾所皆知(?)的這次的改寫重點是在 JavaScript 上,整個 codebase 中CoffeScript 與 Ruby 的比例到達了 1:1 之譜。也就是 new Basecamp 實質上是個「JavaScript Application」。另外再利用 Stacker (advanced puhState-based engine for sheets) 大幅降低 HTTP requests。

2. Cache TO THE MAX: Russian Doll cache stratgy

雖然 new Basecamp 已經是個 「JavaScript Application」。但有個問題還是存在,身為 backend 的 Rails App 在 render Basecamp 的邏輯時,速度還是不夠快。於是他們採用「Russian Doll」的 Cache Strategy 把能 Cache 的部分擴展到上限…

Russian Doll cache strategy

如名所示,Russian Doll strategy,就是使用層層 cache 嵌套的策略。

這一張圖片的背後 code 會是這樣的寫法:

<% cache @project do %>
  aaa
  <% cache @todo do %>
    bbb
    <% cache @todolist do %>
      ccc
    <% end %>
  <% end %>
<% end %>

再利用 Rails 內建 cache helper 使用 "#{cache_key}/#{id}-#{timestamp}" (出處) 的方式去實作 cache invalidation。如此一來,只要 object 被變更,cache 就會被刷新。

但這招即使如此直觀,還是會遇到 invalidation 上的幾個問題。

1. 更新了 todolist,但是上層 class: todo 卻不知道…

todlist 更新了,所以 updated_at 會被更新。不過 todo 卻不知道 todolist 的更新,所以整塊並不會被更新。

解法:

不過解法容易。可以透過 belongs_to :todo, :touch => truebelongs_to :product, :touch => true。從最底部的 todolist,層層連鎖更新到最上層。

2. 更新了 code block,但 object 內容卻因為沒更新而不會 expire。

當我把 ccc 改成 zzz 時且打算 deploy 時,問題來了...。整套 cache 機制是基於 object 更新,而不是 code 更新。所以 cache 並不會 invalid….

<% cache @project do %>
  aaa
  <% cache @todo do %>
    bbb
    <% cache @todolist do %>
      zzz
    <% end %>
  <% end %>
<% end %>
解法:

這邊有另外一個寫法可以閃過這個地雷,就是為這整段 code 加上版本號:

<% cache [v15,@project] do %>
  aaa
  <% cache [v10,@todo] do %>
    bbb
    <% cache [v45,@todolist] do %>
      zzz
    <% end %>
  <% end %>
<% end %>

如果我要將 todolist block 那塊更新,要強制 invalid,我可以把 v45 改成 v46。這樣就更新了。

不過如果這一塊 view 上面還有外層 cache 嵌套,v10 要跟著變成 v11v15 要跟著變成 v16

有點麻煩了…

但這還不是最糟糕的…

3. cache 的部分散落在 partial 裡面,版本號更新不易

改版本號麻煩但還算可以接受。但這只限於都在同一張 view 裡面的狀況。

若是 cache 被放在 partial 裡面,被多個 view 引用呼叫,那就麻煩了…

_todolist.html.erb

<% cache [v45,@todolist] do %>
  zzz
<% end %>

改版本號的手續就變成地獄了…。因為你永遠都會有忘記清掉的 view…

解法:

暫無。認命的改吧(?)

4. 逐漸冗長的 syntax 問題..

而使用版本號閃避 cache 還會造成,原本直觀的

  <% cache @todolist do %>
    zzz
  <% end %>

為了要 invalid cache 的問題,被迫使用 trick 去 bypass。

  <% cache [v45,@todolist] do %>
    zzz
  <% end %>

可不可以單純一點,我們寫 code 還是回到直觀的 cache @object,然後以上談到的這些問題都會自動解決?

cache_digests 就是這一切的答案:md5_of_this_view

cache_digests 就是 DHH 解決這一切惱人問題的手段。

而且解決策略也非常簡單,既然大家都在版本號上面 GGYY,那麼其實最快的方式就是 md5_of_this_view !!!

cache_digests 允許開發者繼續使用這樣的 code:

  <% cache @todolist do %>
    zzz
  <% end %>

但!cache_digests 自動幫忙計算此 block 裡面的 code 產出的內容的 md5,以此 md5 作為 cache key,從而達到自動 invalid 的效果。

同時,這個 gem 也會自動解決層層嵌套的 dependency 問題…

小結

這一個 gem 前前後後不到 150 行。卻解決了一個非常重要的 cache 問題,也難怪會變成 Rails 4 之後內建的功能。

gem 雖然直觀。不過翻出這些前因後果還真是不簡單,在寫這篇文章的確也花了我花了一點時間去蒐集資料。從 37signals 釋出的一些小片段去把內容組出來。

相關連結:

 
about 5 years ago

這是我今天在 Ruby Tuesday #21 所寫的投影片。以下文章是寫投影片前已經擬好的草稿。可以配著服用

Rails Developer 在使用內建工具開發網站時,若是由小做起,通常不會踩到這些雷。但是若一開始開站資料就預計會有 10 萬筆、甚至 100 萬筆資料。執行 db 的 rake task 通常往往會令人痛苦不堪。

在這篇文章內,我整理了一些處理巨量資料必須注意的細節,應該可以有效解決大家常遇到的問題:

1. 盡量避免使用 ActiveRecord Object

ActiveRecord 當初的設計目的是為了框架內「商業使用」。它的工作是將純資料化為具有商業邏輯的 Ruby Object,並且配合框架,設計了多層 callbacks。

簡單來說,它並不是為了「處理 raw data」而設計。如果開發者只是要作一些簡單的資料操作,建議的方式請直接下 SQL,不要沾到任何 ActiveRecord。

(但大多數開發者直覺都是會開 ActiveRecord 下了條件就直接跑迴圈,忘記 MySQL 是可以直接拿來下指令的)

當然,沒有 ActiveRecord 這麼抽象化的工具,下純指令也是蠻痛苦的一件事,我推薦可以換用 sequel 這套工具試看看。

再者,在實務操作上我也建議避免使用 ActiveRecord + 內建的 rake task 操作巨量資料。原因是,開發者會順帶會把整套的 Rails 環境都載進來跑,其慢無比是正常的…

2. 有 update_all 可以用,少用 for / each。

通常會出問題的 code 是長這樣的:

posts = Post.where(:board_id => 5)

post.each do |post|
  post.board_id = 1
  post.save
end

這段 code 非常直觀,但會造成許多的問題。如果符合的條件有 10 萬筆,大概放著跑一天都跑不完....

先提供快速解法。Rails 提供了 update_all 可以下。可以改成這樣

Post.update_all({:board_id => 1}, {:board_id => 5})

基本上就是等於直接幫你下 update 的 SQL 啦。同樣資料量跑下去大概只要 10 秒秒以下左右吧。

3. 不要傻傻的直接 Post.all.each,可以用 find_in_batches

直接叫出所有符合的資料(Array) 是一件危險的事。如果符合條件的資料是 10 萬筆,全拉出來有高達 10G 的大小,嗯…我想機器沒個 10 G 以上的記憶體,指令下去機器直接跑到死掉有極大的可能性…

Rails 提供了 find_in_batches

Post.find_in_batches(:conditions => "board_id = 5", :batch_size => 1000) do |posts|
  posts.each do |post|
    post.board_id = 1
    post.save
  end
end

如果沒下 batch_size 預設一次是拉 2000 筆。可以一次指定小一點的數目,如一次 500 筆去跑。

4. 使用 transaction 跳過每次都要 BEGIN COMMIT 的過程,一次做完 1000 筆,然後再 COMMIT。

打開 Rails 的 development.log,這樣的 LOG 應該對你不陌生。

   (0.3ms)  BEGIN
   (0.5ms)  COMMIT

Rails 開發時,為了確保每比資料正確性,儲存的時候都會過一次 transaction,於是即使已經照 3 這樣的解法,還是要過 10 萬次 COMMIT BEGIN。很浪費時間。

Post.find_in_batches(:conditions => "board_id = 5", :batch_size => 1000) do |posts|
  Post.transaction do 
    posts.each do |post|
      post.board_id = 1
      post.save
    end
  end 
end

如果你只是要 update 少量欄位,而且資料處於離線狀態,可以使用 Transactions 搭配 find_in_batches,做完兩千筆再一次 commit,而不是每次做完就 commit 一次,在資料量很大的狀況下也可以節省不少時間。

5. 使用 update_column / sneacky-save 而非原生 save

用原生 save 會有什麼問題呢?原生的 save 在資料儲存時,會經過一堆 validatorcallbacks,即使你只是要簡單 update 一個欄位,會觸發到一狗票東西(假設 10 道 hook),那 10 萬筆就是過 100 萬道 hook 了啊。天啊 /_\,機器死掉不意外。

如果你想要閃掉 hook 的話,可以使用 update_column,

posts.each do |post|
  post.update_column(:board, 1)
  post.save
end

但 update_column 的缺點是一次只能 update 一個欄位,如果你有 update 多個欄位的需求,可以用sneacky-save 這套 gem。

如其名,sneacky-save 偷偷儲存不會勾動任何天雷地火。

6. 可以的話使用 Post.select("column 1, colum2").where

很多人會忽略一件事,Post.where("id < 10"),其實是把這 10 個 object 拉出 database。Post 裡面有什麼呢?會有幾千字的 content 啊。所以當你下了這道 comment 後,拉出來的是這些內容

Post Load (18.8ms)  SELECT `posts`.* FROM `posts` WHERE (id < 10)

拉出 10 萬筆會發生什麼事呢?(炸)

所以這也是我建議如果你沒有複雜操作(相依高度 model 邏輯)需要的話,千萬別碰 ActiveRecord,因為你不會知道會按下哪一顆核彈按鈕。

7. 使用 delegate 把大資料搬出去

ActiveRecord 裡面有 delegate 這個 API。如果你嫌要 Post.select("column 1, colum2").where 這樣東閃西閃很麻煩,還是希望使用 SELECT post.*。那麼不妨可以換一個思路,把肥的 column 丟到另外一個 table,再用 delegate 接起來。

class Post < ActiveRecord::Base
  has_one :meta
   
  after_create :create_meta
  
  deleage :content, :to => :meta
end

8. 操作資料前,別忘記打 INDEX

舉凡操作資料,多半是至少會先下個 condition。再看是直接用 SQL 處理掉還是跑迴圈。不過一般開發者最會中地雷的部分就是

  • 忘記打 index

忘記打 index 下 condition ,就會引發 table scan,這當然會很慢啊 /_\

  • 對 varchar(255) 直接打 index

使用 Rails 產生的 varchar,多半是 varchar(255),很少有人會直接去改長度的。而且使用 Rails 直接打的 index,也就是全長的 index 打下去了。效率爛到炸掉。

可以用這招 index 可以指定只取前面 n chars 的方式增進效率

ALTER TABLE post DROP INDEX PTitle, ADD INDEX(PTitle(13));

Percona 前幾天也有一個 talk 是 MySQL Indexing Best Practices,值得參考。

9. delete / destroy,刪除很昂貴。確保你知道自己在幹什麼。

首先第一件事要分清楚 delete 和 destroy 有什麼不同。

  • destroy 刪除資料並 go through callbacks
  • delete 刪除資料,不過任何 callbacks

所以要刪除資料前,請確認你用的是何種「刪除」。

destroy_all 和 delete_all 也是類似的原則。

找到符合特徵的紀錄,然後呼叫 destroy method。在這個動作中會引發 callbacks ….orz

找到符合特徵的紀錄,刪掉,但不觸發 callbacks

不過如果你真的要「清空 DB」。不要用 delete_all,MySQL 提供了:TRUNCATE 給你用。請用這個...

  • TRUNCATE TABLE
ActiveRecord::Base.connection.execute("TRUNCATE TABLE #{table_name}")

雖然 delete 不觸發 callbacks,但是「刪除」DELETE 真的很慢,因為
DELETE 涉及到會 update index,所以會…很慢。http://stackoverflow.com/questions/4020240/in-mysql-is-it-faster-to-delete-and-then-insert-or-is-it-faster-to-update-exist

如果你的資料要作大量的刪除動作,有兩種思路可以繞。

一個是使用軟性刪除 soft_delete,也就是加上標記標示已刪除,但實質上不從資料庫刪除資料,只 update 會比 delete 快一點。有 acts_as_archive 可以用。

另外一個想法是:與其用刪的 (DELETE) 不如用 塞的 (INSERT)

開一個新的 Table,用倒的,把 match 的 record 塞到新的 DB 去。INSERT 比 DELETE 快太多了。

10. 無法避免的昂貴操作丟到 background job 去操作。

使用 posts.each 是一個昂貴的線性操作。這個 process 會無限的膨脹及 block 資源。

所以可以改用一個作法,使用 background job 如

把昂貴的操作包成獨立事件。塞進 queue 裡面,丟到背景跑,然後開 10 支 worker,十箭其發,速度可以快不少。

之所以把 delayed_job 列出來又不推薦的原因是因為 delayed_job 清 queue 的方式是用 DELETE,在第九點我們談過了,在有大量資料的情況下,「刪除」這件事會非常昂貴。使用 delayed_job 無異是拿汽油澆火。

結論

十點列下來。我的建議是,如果你手上的資料量大到一個程度,能儘量回歸基本(SQL command)就回歸基本。因為使用 ActiveRecord ,開發者永遠不知道自己什麼時候會按下核爆彈的按鈕啊…

其他

目前我們固定在禮拜二,都會在 松江路的田中園 上舉辦 Taipei Rails Meetup。我自己本身也會固定在這裡免費幫大家解答 Rails 與 Web Operation 相關的問題。而坦白說,最近一些比較經典的 Post 也是從聚會裡的問答集裡面萃取出來的。

如果你對 Rails 有濃厚的興趣又住在台北,歡迎每週加入我們,謝謝!

 
about 5 years ago

朋友的公司最近遇到一些公司成長上的問題。這些問題搞的他很頭大,於是也請我幫他想想辦法。看問題到底是出在哪裡…

公司裡面的員工,在當初面試時都沒什麼異狀,但進來之後有一些工作上的問題搞得他頭很大。

原因是有些人的職能明顯有落差(也就是當初面試進來時,是希望他補上這個工作的缺乏產能,但本身技能在進入這個團隊,跟著運轉時跟不上)。而他在幫忙修正 Coach 這些同事時,發現了一個大問題。

有人被指正一講就聽,馬上有顯著的進步。有些同事卻出現明顯的認知落差,明明知道自己已經出問題了,卻還是想要照自己的那一套「發揮」。類似的「發揮」病,也出現在一些菜鳥身上。菜鳥很明顯的基本功夫打沒打穩、團隊目標也沒摸清楚,就想要自作主張的改一些方向,造成白工。老是挑一些不是問題的問題反應,希望反應證明自己的才能。就算被電了,過沒多久還是會重複發生同樣的事情…

「發揮」病讓他一個頭兩個大。希望我幫他把脈解決…

本來這是別人的事情,加上這種事情其實在大公司也時常發生(以前我也遇過...),所以我也隨口安慰他:「這些事情本來就會遇到,不是你特別倒楣啦...」想要打發掉他 XD

他還是一直拜託我幫他找問題,因為這個問題讓他很痛。再來是,這些同事都是他「找進來」的...,要是真的救不起來,在「處理」上會非常麻煩…

共同特徵:「發揮病」

聽到「找進來」這個關鍵字,讓我燃起了興趣。於是我就追問他更多詳細的關鍵,員工組成成分…

然後才發現這些「發揮病」的患者有一件共同的驚人特徵,那就是他們真的都是「被從外面找進來的」。都是他透過「私人關係」從外面找來的「朋友」或「熟人」。

OK。找到問題了。Hiring 101:「千萬不要找朋友來當同事,否則通常出差錯了以後 90% 機率連朋友都做不成。而且很多朋友,是只有當朋友的本事而已,技術和職場相處上能不能當同事很難說。」

但是他反駁,當中這些人的技術或潛質是他自己驗證過,也算很不錯的。但進來之後不知為什麼也禁不起考驗。而且不約而同的,「發揮病」很嚴重。個人喜好隱隱約約的似乎遠遠重於團體目標…

「反而」那些是從網路上應徵來的員工,或自己主動投遞履歷進來工作的,幾乎都沒有這種問題。個個都是積極學習,主動了解團隊目標,樂於修正成長的好夥伴。

他很懊惱的抱怨,他不是不願意讓人「發揮」的 Leader,只是部分這些同事的「角色」,第一優先的不是發揮,而是「打穩基礎」(紮實做好手頭工作補上團隊缺乏產能,了解共同目標)。達到了,才能談所謂的「發揮」啊?

為什麼這些人不能學學那些正常的同事呢?

不是每一個人的位子上面都有「客卿」標籤

聽到這裡,我腦袋快速倒轉過幾遍以前遇過的 case。大概知道這個團隊出了什麼問題了。(其實斷斷續續也討論了不少次,一點一點拼起來...)

最根本原因就在於所謂的「客卿心態」。

別誤會,「客卿」並不是不好的詞。

「找來的人」之所以跟那些「主動應徵」的人,其根本心態不同點就在於,他是被「找來」的。既然是被「找來」的就是要來「發揮所長」的,這些同事認為他是「卿」。

這就造成美麗的誤會。有時候,公司「找」員工,並不一定是要找他「發揮」,而是要缺一個位子,希望「找合適技能的人」來補上這個位子「貢獻」。

所謂能夠讓人「發揮」的位子,多半是個獨立的職缺,或者是組織主管的位置。而讓人「發揮」的位子,身為主管,多半也會先幫他掃除一些障礙,比如說先跟團隊成員提醒這位是新主管,請大家多多配合。或者是這位新同事,有特殊的才能,但做事也有自己獨特的規矩…etc.(讓他融入團隊時比較順暢)

但是如果只是一個一般的職缺,公司怎麼可能特別為這個位子特別作這些事。但問題是,被「找來」的同事不會這麼想,他會認為他是來「發揮」的,也就是在一開始就會跟那些主動來應徵的人心態上就有根本的不同,潛意識上他的優先權不會是先去管別人的 rule 是什麼,甚至還會產生自己是卿所以自己比較厲害的心態,認為新同事應該「讓」他。

他自己會趕快想把私人壓箱寶拿出來,「作一些事」。然後就造成悲劇了…

當然,能夠發現自己有錯誤心態而趕快修正的人,不是沒有,而是相對比例並沒有那麼多…

延伸閱讀:The Startup Owner's Manual 讀書心得(2): New-product Introduction Model 致命的九宗罪 # 7. Sales and Marketing Execute to a Plan

相反地,來應徵的人或主動投遞,就通常沒有這一狗票問題。因為這些同事的出發點,是來「加入一個他想要工作的團隊」的。他們通常會假設這個團隊已經有自己獨立運作的一套 rule 了。他會想要先搞清楚這個 rule 在哪裡,如何將自己 fit in。而不是讓團隊來 fit in 他…

小結

Startup 最珍貴的資產就是同心一致的團隊,最害怕的是搞不清楚狀況的團隊成員各行其是…

不少 Startup 團隊在一開始草創時,缺乏自信或管道,找到戰力。因此都會想透過熟悉的渠徑「找」到人補上空缺,繼續往目標前進。

只是現在看起來,這個「找」,看起來還是要好好的看狀況使用啊…

 
about 5 years ago

睡前看到 DK 在 twitter 講 Percona 有一場 Webniar 在講 MySQL index 的 best practices。

結果連過去看時發現已經結束了。不過還是不死心的註冊了一下…

大概半小時後系統通知影片和 slide 在 http://percona.tv 已經可以抓了…

內容講的蠻紮實。教了不少讓開發者判斷 Index 如何下、下得好不好的準則…

有時間應該整理成講義的…

===

打完這篇要去睡之前,又在 twitter 上看到 confreaks 丟出了新的 pry 影片 http://confreaks.com/videos/959-mwrc2012-prying-into-your-app-s-private-life。(前幾天寫過的 Pry :新一代 Debug 利器 )

 
about 5 years ago

提起 Pry,一般 Ruby 開發者幾乎對這套 Gem 沒有很深的印象。比較有在追社群新聞的人,會知道這是一套新的 IRB 取代方案,但僅此於如此。事實上在近一年前,Pry 被 Ruby5 報導的原因 也是因為很炫的 console。

比如說 Pry 允許開發者在 console 這樣幹:

pry(main)> cd Article
pry(#<Class:0x1022f60e0>):1> self
=> Article(id: integer, name: string, content: text, created_at: datetime, updated_at: datetime, published_at: datetime)

Article.first

pry(#<Class:0x1022f60e0>):1> first
=> #<Article id: 1, name: "What is Music", content: "Music is an art form in which the medium is sound o...", created_at: "2011-08-24 20:35:29", updated_at: "2011-08-24 20:37:22", published_at: "2011-05-13 23:00:00">

cd name

pry(#<Article:0x102300c98>):2> cd name
pry("What is Music"):3> upcase
=> "WHAT IS MUSIC"

允許了開發者利用 console 進行程式的進階探索。當然這樣的 feature 是很炫。但是不算很大幅解決了開發者的問題,所以只被當作是一套還不錯的 shell。就這麼被大家靜悄悄的撇在身後了…

killer feature: binding.pry

但是大家比較沒有注意到的是,Pry 真正強大的地方不在於它的 console,而是在後面接著演化出的 binding.pry

binding.pry 做的是 Runtime invocation。也就是可以在執行時攔截呼叫。這樣講你可能沒有感覺。

真正厲害的用途是: 例如搭配 Rails 使用,在程式碼裡面插入 binding.pry。打開 rails s

class CourseController < ApplcationController
  def show
    @course = Course.find(params[:id])
    binding.pry
  end

當 browser 打開 http://localhost:3000/courses/30,pry 會自動攔下 request,跳出 console 供開發者 debug 。

From: /Users/xdite/Dropbox/projects/mentorhub/app/controllers/courses_controller.rb @ line 20 CoursesController#show:

    20: def show
    21:   @course = Course.find(params[:id])
 => 22:   binding.pry
    23: end

開發者可以在 console 直接就拉出 @course 這個 object 出來看

[1] pry(#<CoursesController>)> @course
=> #<Course id: 30, name: "voluptas", user_id: 1, course_topic_id: 2, plan: "Laboriosam labore soluta debitis excepturi consequa...", hourly_rate: 822, location: "Taipei", course_type: nil, created_at: "2012-08-12 09:41:21", updated_at: "2012-08-12 09:41:21", video_link: nil, video_link_html: nil>

也可以繼續追下去看裡面的東西

[2] pry(#<CoursesController>)> cd @course
[3] pry(#<Course>):1> plan
=> "Laboriosam labore soluta debitis excepturi consequatur et eos et et praesentium doloremque. qui debitis ab est rerum aut velit fuga ut nemo omnis eum praesentium voluptatem ut. eum fugit rerum fuga error architecto quod nesciunt assumenda in. dicta "

binding.pry 可以 Runtime 攔截呼叫物件,這讓開發者在寫一些複雜 Library 或者是 API 交涉資訊時,頓時就變得如虎添翼。因為每次在解決這類需求時,狀況都很像被綁黑布蒙著眼開發,最討厭的就是每次還要不斷的執行「印出」 debug,效率低落的驚人。

pry-nav

也因為 binding.pry 太好用。社群也基於 Pry 繼續做了其他的 pry 的 plugin。最 killling 的就是 pry-nav

pry-nav 做的就是可以讓你在 binding.pry 的攔節點前後,作 nextstep。直接一行一行的逐一 debug。

相信我,如果你在寫通訊交涉的 Library,或者是正在改複雜的 Rails View。用到 pry + pry-nav 鐵定會感動到哭出來 XD

pry-remote

Pry 搭配 Rails,在往常的作法只有 rails s 可以叫出 debug console 而已。但很多人實際上是使用 Pow 作為開發用 HTTP Server。

這樣的需求可以用 pry-remote 解決。pry-remote 的作法是把原本的 bindig.pry 改成 binding.remote_pry

binding.remote_pry 會開一支 DRb 起來,開發者再用 pry-remote 連到 debug console。

小結

Pry 在短短一年間,已經默默的演化出一個龐大的生態圈,只是這當中的過程並沒有大張旗鼓,所以很多開發者並沒有發現 Pry 其實已經默默從 console shell 進化到超強 Debugger 了。

Pry 的 wiki 上有著相當大的相關資源,相當值得各位繼續探索下去…

同場加映

rack-webconsole 一樣是 pry 的應用,可以在 webpage 裡面直接開 console 改東西…超酷的

追加

Confreaks 最近又釋出了 Moutain West Ruby conf 的 Pry talk http://confreaks.com/videos/959-mwrc2012-prying-into-your-app-s-private-life

 
about 5 years ago

最近跟朋友一個討論的話題,就是台灣這麼多人在網路創業,尤其是台灣也存在著不少質優的 developer,但為什麼所謂的網路創業為什麼都「不算成功」或甚至失敗得很徹底。

因為我也在創業的這條路上,這一兩年來我一直在思考這件事情,到底問題在哪裡?

一直到最近的這幾個禮拜我大概理出一個頭緒:原因是太多人把「創業」當作是一個「目的地」,而不是一個職業、解決問題的過程,為想創業而創業,所以所謂的失敗率才這麼高...。

我知道這樣的結論可能會招致很多反對的炮火聲,但請先耐著性子繼續讓我把最近歸結出的想法說完:

「上班」到「創業」不是一個「打怪」「升等」路線

這一個想法是從 給下個年輕世代的殘酷真相得出來的靈感。這篇文章有一段是關於年輕人對於未來的憧憬:

「22到24歲時念個好的研究所。在25歲左右開始第一份工作然後住自己租的公寓。順利的話我想要在28歲左右自己開公司,大約30歲左右結婚。我想我多數的同學和我在財務上想像我們能夠在28歲時擁有自己的車子,30歲時開始存錢準備有天能夠買自己的房子。」

如果你已經出過社會幾年了,就會知道這真的如同原文作者鐘先生所說的,是一個非常天真的夢。而在這個年代,你可能很難在 30 歲前達到這樣的夢想。這卻是這個世代普遍受過大學教育年輕人所共同的夢。

而這段話也意外彰顯出一個迷思:「受一個不錯的教育,預備找到一個好的工作。工作一段時間,升到不錯的職位得到不錯職業的薪水,最後創業達到財務自由。」

yes。「最後」「創業」

我們把從上班到創業當成是一個「打怪」「升等」路線,問題是真實生活卻不是這麼回事。

「上班」的終點不是「創業」

「上班」的終點不是「創業」。這是我最後思索驗證出來的結論。(雖然乍看之下好像是廢話)

我一直以來有一個謎團未解:為什麼有人「沒什麼技術」創業卻會成功,有人功夫不錯,為什麼創業卻會去失敗?

我想這也是大部分創業者共同的疑惑。幾年來我一直思考,但沒有答案。

直到最近才意外的在一本書裡面得到了一個比較可靠的模型,找出了一點頭緒,這本書的書名是:川普、清崎點石成金

清崎由一個模型為這個問題做出了解釋:它把所有人分成四種類型:

  • Employee(受僱者、僱員):為他人工作而賺取薪金,追求安全、穩定,畏懼風險的一群。
  • Self-employed(自僱者、專業技能者、自由職業者、小企業主):擁有某一專長而能為自己工作而賺錢,重視完美,不輕易將職責交託予人,如:醫生、律師‧‧‧等等。
  • Business owner(企業所有人、僱傭者、僱主、老闆):擁有一個能夠良好運轉的企業系統,視風險為挑戰、歡迎問題並樂於透過解決問題而致富的一群,信奉以別人的時間(OTHER PEOPLE'S TIME,OPT)以及別人的金錢(OTHER PEOPLE'S MONEY,OPM)為他們工作,收入來源是企業的收益。
  • Investor(投資者):讓錢為他們工作,收入來源是各種投資,用錢來產生出更多的錢,即是「富爸爸」一書中所強調「讓金錢為你工作」。

在這本書中,他指出世界上最有錢的人都是 B。(而非大家以為的 I )

且清崎認為,身處 E、S兩種象限,無法令自己達至財務自由。我們應該透過成為B、I象限,才能達到目標。

無可厚非的大家都想要變成 B,或變成 I 。但有幾種身分轉變模式,很容易失敗,分別是(E -> I , E -> B , I -> B )。而比較容易成功的是 ( S -> B ) 或者是 ( B -> I )。

為什麼一些創業者,創業不久後會瞬間就 fail 是因為他們往往在 E 階段,就直接想往 B 階段跨過去,缺乏太多存活的技巧,所以就直接陣亡。清崎建議的路線是,如果你想成功的話,採取 (E -> S -> B) 的路線,機率是會比較高的。

這個模型解答一些疑惑(為什麼有人快速陣亡),但卻沒有回答到另外一些問題:為什麼有人直接走 E -> B 或甚至直接 B 卻成功了。

「解決問題」然後才「創業」

Max 就是典型的例子,他是直接就當 B 的人(還有一些創業成功的網路界朋友是 E-> B)。E -> B 成功不是不可能。那麼關鍵點在哪裡?Max 不會寫 code,但他事業成功了。我也問了 Max,Max 只跟我說了他「解決了問題」,「也許應該是這樣」。

很多創業文章的重點,都是勸創業者實際「踏出辦公室」「實際解決問題」。這些文章的道理是不錯,總是令我覺得說不出的哪裡怪。

最近還有一篇文章 互連網創業降級論。也是說不出的詭異。

後來我終於想清楚所謂邏輯的謬誤在哪裡。所謂的「創業」應該是創業者有一個問題,創業者為了解決它,而製造了方法,最後重新將此方法規模化,乃所謂「創造一個事業」。而目前的網路創業很多卻是所謂的「創業者」手上擁有了一堆技術,然後到處找問題,想把這些「技巧」變成「解決的方法」。難怪失敗率很高。

因為創業者不是真真切切擁有一個「很痛的」問題,然後製造一個方法解決它。而是賭自己的方法「能夠找到一個問題而恰好」解決它。能夠賭中的機會已經夠低了。而碰上這個「問題」恰巧「很痛」的機會又更低,這個問題不夠痛,造成利潤追不上成本,最後虧本。

這就解釋了為什麼那些「沒有技術」的人為什麼能夠網路創業成功,他們並非所謂的幸運。因為他們並非「沒有技術」,他們擁有珍貴的「解決問題的 Domain Knowledge」和其他建構事業所需的綜合技能(如 Leadership, Finace, Accounting, Sales),缺的是「網站建構技術」。但這不會阻止他們成為 B。因為這樣東西可以用資本買到,品質的高低並不會太大方面影響到能夠解決問題的核心能力。

而只有「網站建構技術」,卻無法單獨自己形成一個生意。因為這項技術並沒有解決任何問題。(除非你的事業就是販售前者製作好的網站或者是使用這些技術解決同領域的問題)

所謂的 ESBI 模型,缺陷的部分就在於:對於 S 的解釋過於單薄。癥結點在於若創業者的 S 與 B 的「領域」並不是同一個的話,S -> B 的成功機率是很低的。

這也解釋了為什麼很多網路創業最終以失敗收場。因為這些 S 者,專精的領域是軟體、行銷,而非 Bussiness Domain。而那些成功的 B 者,並非幸運,而是因為他們都是該領域的 solution provider。

小結

繞了這麼遠,才終於把這套想法梳理成一個脈絡。為什麼清崎的建議是走 E -> S -> B。這是因為不一定有人可以一次走 B 就能成功。而作為一個 B,所需要的技能也並不僅只於單一方面的技術純熟就可以達成。所以走 E -> S -> B 是一個可靠的路線。但這絕不保證你走了 E -> S,就能到 B。

而要成為所謂的 B ,重點也不在於之前累計多少技巧,而是在「解決核心問題」的能力。「解決問題」,然後最後會變成「創業」,然後就會得到「超額回報」。

但是為了有一個生意而去製造一個生意,而不是把精力放在解決問題之上,通常結局不是失敗就是繞了超長的遠路....

終於或多或少了解了一些這樣的來龍去脈...