123,123

Rope：理論與實(shí)踐

作者：網(wǎng)絡(luò)轉(zhuǎn)載發(fā)布時(shí)間：[ 2013/3/4 15:49:37 ] 推薦標(biāo)簽：

為了改進(jìn)這種情況，Matcher應(yīng)該而且能夠利用 Rope迭代器提供的更快的 O（1）訪問(wèn)時(shí)間。為了掌握這種方法，首先需要理解 Matcher到其 CharSequence的訪問(wèn)模式。

正則表達(dá)式匹配常見(jiàn)的場(chǎng)景是從字符序列的某個(gè)點(diǎn)上開(kāi)始，向前移動(dòng)，直到找到所有匹配，并到達(dá)序列末尾為止。在這個(gè)場(chǎng)景中，匹配器主要是向前移動(dòng)，一次通常移動(dòng)不止一個(gè)字符。但在少數(shù)情況下，匹配器被迫向后移動(dòng)。

很容易能將 Rope迭代器改成一次向前移動(dòng)不止一個(gè)字符。但是向后移動(dòng)要復(fù)雜些，因?yàn)榈鲀?nèi)部執(zhí)行的是深度優(yōu)先算法，預(yù)先排好了 Rope遍歷的順序，需要訪問(wèn)每個(gè)葉節(jié)點(diǎn)。遍歷堆棧沒(méi)有足夠的信息能夠前移到前一個(gè)葉節(jié)點(diǎn)，但是如果促使向后移動(dòng)的信息量沒(méi)有使迭代器離開(kāi)當(dāng)前葉節(jié)點(diǎn)，那么迭代器有可能服務(wù)請(qǐng)求。為了說(shuō)明這個(gè)作法，圖 5 顯示一個(gè)虛構(gòu)的迭代器的狀態(tài)，它能夠向后移動(dòng)一、二、三、四個(gè)位置，但不能移動(dòng)更多位置，因?yàn)檫@要求訪問(wèn)前面訪問(wèn)的葉節(jié)點(diǎn)。

為了支持這一新功能，可以修改 Rope的 charAt方法，這樣在第一次調(diào)用的時(shí)候，在指定位置上構(gòu)建一個(gè)迭代器。后續(xù)的調(diào)用會(huì)將迭代器前后移動(dòng)指定的距離。如果迭代器不能后移指定的距離，那么執(zhí)行默認(rèn)的 charAt例程取得字符的值 —這種情況很少發(fā)生。

因?yàn)檫@種優(yōu)化無(wú)法做到普遍適用，而且要求引入新的成員變量，所以好不要直接將它添加到 Rope類。相反，可以根據(jù)需要用這個(gè)優(yōu)化修飾 rope。為此，Ropes for Java 在 Rope類中包含了一個(gè)方法，能夠?yàn)橹付ǖ哪Ｊ缴蓛?yōu)化的匹配器。清單 5 演示了這種方法：

清單 5. 優(yōu)化的正則表達(dá)式匹配

Pattern p = ...
Matcher m = rope.matcher(p);

清單 5 中第二行調(diào)用對(duì) rope 進(jìn)行修飾，優(yōu)化正則表達(dá)式匹配。

表 7 提供了這種方法的測(cè)評(píng)結(jié)果，并包含了以前的結(jié)果（表 6）以便進(jìn)行對(duì)照。

技術(shù)	時(shí)間（單位：納秒）
`String`	75，286，078
`StringBuffer`	86，083，830
`Rope`	12，507，367，218
重新均衡后的 `Rope`	2，628，889，679
`Rope.matcher`	246，633，828

優(yōu)化的結(jié)果比起重新均衡后的 rope 明顯提高了 10.6 倍，使 rope 的性能與 String性能的差距縮小到 3.2 倍之內(nèi)。

應(yīng)用程序

什么時(shí)候不應(yīng)使用 rope企業(yè)級(jí) Java 應(yīng)用程序經(jīng)常包含類似下面的代碼：

String x = "<input type='text' name='name' value='"
+ escapePcData(bean.getName()) + "'>";

x 隨后放在 HTML 內(nèi)發(fā)送到客戶機(jī)瀏覽器。用 rope 代替編譯器默認(rèn)生成的 StringBuilder來(lái)計(jì)算 x 的值是否有意義？

回答是否，原因有幾個(gè)。首先，這里要連接的數(shù)據(jù)的數(shù)量比較小，所以使用 rope 不會(huì)提高性能（雖然能夠提高健壯性和伸縮性）。（請(qǐng)?jiān)O(shè)想一下 getName出人意料地返回 50 MB 字符串時(shí)這兩種解決方案會(huì)如何反應(yīng)。）

但是出于討論的目的，假設(shè)有許多塊數(shù)據(jù)進(jìn)行連接。由于 Rope的附加性能通常比 StringBuffer好，這時(shí)使用 rope 是否有意義呢？答案還是否。不論何時(shí)將輸入的數(shù)據(jù)組合在一起形成格式化輸出時(shí)，漂亮有效的方法是使用模板引擎（例如 StringTemplate 或 FreeMarker）。這種方法不僅能干凈地將表示標(biāo)記與代碼分開(kāi)，而且模板只進(jìn)行一次編譯（通常編譯為 JVM 字節(jié)碼），以后可以重用，從而使它們擁有的性能特征。

使用模板的第二個(gè)好處暴露了對(duì)于類似以上代碼中那些輸出構(gòu)建例程（包括用 rope 編寫(xiě)的例程）常見(jiàn)的基本缺陷。這個(gè)好處是：可以對(duì)模板進(jìn)行逐步評(píng)估，而且輸出一旦生成可以寫(xiě)入 Writer，不必先在內(nèi)存中累積。在 Java EE 應(yīng)用程序中，Writer實(shí)際是到客戶機(jī)瀏覽器的緩沖的連接，這種輸出方法呈現(xiàn)恒定的內(nèi)存量 —— O（1），而其他解決方案的內(nèi)存使用則是 O（n）。這對(duì)應(yīng)用程序的可伸縮性和健壯性都是巨大的改進(jìn)，雖然對(duì)小的輸出或較低的應(yīng)用程序負(fù)載來(lái)說(shuō)不是那么明顯。（請(qǐng)參閱參考資料中兩篇關(guān)于流式架構(gòu)的文章的鏈接，獲得進(jìn)一步解釋和定量分析。）
.現(xiàn)在對(duì)于 rope 的性能已經(jīng)有了很好的理解，可以考慮 rope 的一些傳統(tǒng)用法，以及在 Java EE 應(yīng)用程序中吸引人但很可能并不恰當(dāng)?shù)挠梅ā?/p>

雖然 rope 可以作為一種通用方法替代字符串的連續(xù)內(nèi)存表示法，但是只有在大量修改大型字符串的應(yīng)用程序中才能看到明顯的性能提升。這可能并不讓人驚訝，因?yàn)樵绲?rope 應(yīng)用程序是用來(lái)在文本編輯器中表示文檔。不僅在特大的文檔中能夠以幾乎恒定的時(shí)間執(zhí)行文本插入和刪除，rope 的不可修改性還使得 “撤消堆棧（undo stack）” 的實(shí)現(xiàn)非常容易：只要在每次修改時(shí)保存對(duì)前一個(gè) rope 的引用即可。

另一個(gè)更加神奇的 rope 應(yīng)用是表示虛擬機(jī)的狀態(tài)。例如，ICFP 2007 編程競(jìng)賽中有一個(gè)比賽是實(shí)現(xiàn)一個(gè)虛擬機(jī)，要求每個(gè)周期都修改它的狀態(tài)，并針對(duì)某些輸入運(yùn)行數(shù)百萬(wàn)個(gè)周期（請(qǐng)參閱參考資料）。在一個(gè) Java 實(shí)現(xiàn)中，虛擬機(jī)的速度提高了三個(gè)數(shù)量級(jí)，從 ~50 周期 / 秒提高到超過(guò) 50，000/ 秒，這是通過(guò)使用 Rope代替專門(mén)的 StringBuffer來(lái)表示狀態(tài)而做到的。

未來(lái)的研究方向

雖然 Ropes for Java 是一種新庫(kù)，但底層概念并不新鮮，該庫(kù)看起來(lái)實(shí)現(xiàn)了 rope 的性能許諾。但是，該項(xiàng)目希望通過(guò)以下方面在未來(lái)的發(fā)行版中對(duì)庫(kù)的某些方面進(jìn)行改進(jìn)：

•提供其他常見(jiàn)字符串操作的高性能實(shí)現(xiàn)。

•編寫(xiě)適配器，將 rope 無(wú)縫地集成到 Scala和面向 Java 平臺(tái)的其他高級(jí)語(yǔ)言。

•通過(guò)進(jìn)一步的自動(dòng)測(cè)試提高質(zhì)量。Ropes for Java 既使用手工編寫(xiě)的 JUnit 自動(dòng)測(cè)試進(jìn)行了測(cè)試，也通過(guò) JUnit 工廠自動(dòng)生成的測(cè)試進(jìn)行了測(cè)試。集成 ESC/Java 2檢驗(yàn)過(guò)的 Java 建模語(yǔ)言（JML）標(biāo)注可能會(huì)進(jìn)一步提高質(zhì)量。

上一頁(yè)1 2 3 4下一頁(yè)

關(guān)鍵詞閱讀

測(cè)試熱點(diǎn)文章

技術(shù)專題

活動(dòng)專題

【獲獎(jiǎng)名單公布】加入Alltesting眾測(cè)免費(fèi)領(lǐng)取新發(fā)行測(cè)試書(shū)籍
加入Alltesting眾測(cè)免費(fèi)領(lǐng)取新發(fā)行書(shū)籍《京東質(zhì)量團(tuán)隊(duì)轉(zhuǎn)型實(shí)踐從測(cè)試到測(cè)試開(kāi)發(fā)的蛻變》
【Alltesting眾測(cè)2典】0元測(cè)試體驗(yàn)+100元現(xiàn)金券+免費(fèi)性能測(cè)試
先測(cè)試后付費(fèi)-Alltesting眾測(cè)超級(jí)福利
2000元性能測(cè)試服務(wù)，安全生產(chǎn)，穩(wěn)定運(yùn)行，為您的系統(tǒng)保駕護(hù)航�。�！
在線性能測(cè)試工具（WebPR）培訓(xùn)與技術(shù)交流（第二期）
Alltesting眾測(cè)平臺(tái)全新功能已開(kāi)啟��！
生命周期管理軟件ALM-本地安裝版本正式發(fā)布�。�！