干貨分享|Rust“巨坑”?真相來了!
發(fā)布時間:2023-08-17 14:01:31
Rust 是一門極具爭議性的語言。有許多創(chuàng)業(yè)公司的開發(fā)者甚至創(chuàng)始人都點名表示:Rust 是巨坑!簡直浪費時間。再比如,其他語言中的“粗糙編碼”的編程方式在 Rust 中也很難實現(xiàn);庫和文檔也不夠成熟,學(xué)習(xí)起來相當費勁,諸如此類。
但總的來說,在強調(diào)“安全性比開發(fā)生產(chǎn)力更重要”的今天,Rust 從來沒有失去成為一種未來語言的資格。雖然正視缺點很重要,但有些草率的批評也許未必是真相,或者說是不準確的。
今天將為大家展示“不偏不倚”的 Rust 的真實特性。
1、并非所有開發(fā)都是系統(tǒng)編程
2、語言復(fù)雜性
漫長的編譯時間往往會壓垮每一位程序員。用運行速度較慢但編譯速度較快的編程語言編寫的代碼,通常更有機會運行得更快,因為程序員有更多時間來優(yōu)化代碼。
Rust 在通用性難題中故意選擇了緩慢的編譯器。這不一定是世界末日(因為由此產(chǎn)生的運行時性能增益是真實的),但這確實意味著在較大的項目中,開發(fā)者將不得不努力爭取合理的構(gòu)建時間。
rustc 實現(xiàn)了生產(chǎn)編譯器中可能最先進的增量編譯算法,但這感覺有點像與語言編譯模型作斗爭。
與 C++ 不同,Rust 構(gòu)建并沒有笨拙地并行化,并行度受到依賴圖中關(guān)鍵路徑長度的限制。如果有 40 個以上的內(nèi)核進行編譯,則會顯示此信息。
Rust 還缺乏類似 pimpl 的功能,這意味著更改 crate 需要重新編譯(不僅僅是重新鏈接)其所有反向依賴項。
4、相對年輕的語言
Rust 只有 8 年的歷史,相較而言,Rust 還算一門年輕的語言。創(chuàng)建這個新語言的目的是為了解決一個頑疾:軟件的演進速度大大低于硬件的演進,軟件在語言級別上無法真正利用多核計算帶來的性能提升。
根據(jù)林迪效應(yīng),相信“C++ 將在未來十年內(nèi)存在”的人要遠多于對“Rust 將在十年內(nèi)存在”的人。同樣地,如果你編寫的軟件可以使用數(shù)十年,在選擇新技術(shù)之前,往往會再三考慮與之相關(guān)的風(fēng)險。
但慎重考慮并不代表放棄新技術(shù)。一個過去的案例就是,在 90 年代為銀行軟件選擇 Java 而不是 Cobol 事實證明是正確的選擇)。
Rust 目前只有一種完整的實現(xiàn)——rustc 編譯器。另一個最佳替代實現(xiàn),mrustc,有意省略了許多靜態(tài)安全檢查。rustc 目前僅支持一種生產(chǎn)就緒后端 - LLVM。因此,它對 CPU 架構(gòu)的支持范圍比 C 語言更窄,后者具有 GCC 實現(xiàn)以及許多特定于供應(yīng)商的專有編譯器。
最后,Rust 缺乏官方規(guī)范。參考文檔正在開發(fā)中,尚未記錄實現(xiàn)的所有細節(jié)。
5、可替代性
在系統(tǒng)編程領(lǐng)域,除了 Rust 之外,還有其他一些語言,主要是 C、C++ 和 Ada。
現(xiàn)代 C++ 提供了提高安全性的工具和指南,甚至有人為 C++提出了類似 Rust 的生命周期機制。但與 Rust 不同,使用這些工具并不能保證沒有內(nèi)存安全問題。但是,如果你已經(jīng)維護了大量 C++ 代碼,那么檢查以下最佳實踐和使用清理程序是否有助于解決安全問題是有意義的。這很困難,但顯然比用另一種語言重寫它要容易。
如果你使用 C,你可以使用形式化方法來證明不存在未定義的行為,否則你只能詳盡地測試一切。如果不使用動態(tài)內(nèi)存(切勿調(diào)用 free),Ada 是內(nèi)存安全的。
Rust 偏偏是成本/安全曲線上的一個有趣的權(quán)衡點,但肯定不是唯一的不可替代的點。
6、工具
Rust 工具是值得點贊叫好的。基線工具、編譯器和構(gòu)建系統(tǒng)(cargo)通常被認為是一流的。
但是,例如,一些與運行時相關(guān)的工具(尤其是堆分析)目前還不存在——如果沒有運行時工具,就很難分析程序的運行時。此外,雖然 IDE 支持不錯,但它還遠未達到 Java 級別的可靠性。如今,在 Rust 中不可能自動復(fù)雜地重構(gòu)數(shù)百萬行程序。
7、性能
“使用 LLVM”并不是解決所有性能問題的通用方法。雖然我不知道 C++ 和 Rust 的大規(guī)模性能基準,但不難列出一些 Rust 不如 C++ 的性能問題。
最大的一個可能,是 Rust 的移動語義是基于值的(機器代碼級別的 memcpy)。相比之下,C++ 語義使用特殊引用(機器代碼級別的指針),可以在其中處理數(shù)據(jù)。
理論上,編譯器應(yīng)該能夠看穿復(fù)制鏈,但實際上卻常常做不到。要知道, 一個相關(guān)的問題是不放置新的——Rust 有時需要從堆棧復(fù)制字節(jié),而 C++ 可以就地構(gòu)造東西對象。
有趣的是,為了使其盡可能高效而不穩(wěn)定,Rust 的默認 ABI 有時比 C 更糟糕。
8、不安全(Unsafe)的定義
(1)可解釋(非不安全(non-unsafe)的代碼不會導(dǎo)致未定義的行為) (2)@模塊化(可以單獨檢查不同的不安全塊)
其次,據(jù)業(yè)內(nèi)開發(fā)者的觀察結(jié)果是,unsafe 實際上并不是模塊化的。足夠強大的不安全塊實際上可以擴展語言。兩個這樣的擴展,單獨使用時可能沒問題,但如果一起使用,可能會導(dǎo)致未定義的行為、觀察到的等效性和不安全的代碼。