EmEditor v22.0.0 發布(含技術評論)!

我們發布了 EmEditor v22.0.0

EmEditor v22.0 的一個主要功能是模糊符合,它可以使用可自訂的近似字串符合來搜索、篩選和合併 CSV。多個使用者要求了此功能(123)。此功能在 EmEditor Professional 中包含多個選項,而在 EmEditor Free 中只有符合相似字串選項可用。符合相似字串選項使用稱為萊文斯坦距離編輯距離來計算兩個字串的相似程度。換句話說,EmEditor 比較兩個字串並計算從一個字串編輯到另一個字串需要多少步。 例如,如果兩個字串是:

"fuzzx maching" 和 "fuzzy matching"

第一個字串的第五個字元「x」必須取代為「y」,並且必須在第 9 個字元「c」之前插入一個「t」。因此,這兩個字串之間的編輯距離變為 2。

如果您在 EmEditor Professional 的 尋找 對話方塊中選擇模糊符合核取方塊,則會出現模糊符合選項對話方塊,讓您可以使用相似程度最大編輯距離選項來確定符合的相似程度。例如,如果相似程度3/4 (75%),則最多允許每 4 個字元中有 1 個編輯距離符合,但不能超過最大編輯距離選項中指定的編輯距離。換句話說,如果字串的長度為 4 或更大,則最多允許符合 1 個編輯距離,如果字串的長度為 8 或更大,則最多允許符合 2 個編輯距離。

在 EmEditor Professional 中,模糊符合功能提供了更多選項。無需設定上述符合相似字串選項即可使用以下所有選項。其中,忽略不占位的組合字元,例如變音符號、dakuten(日文中的濁點)和 handakuten(日文中的半濁點)選項特別有用,如果您想忽略變音符號、dakuten、handakuten 和其他不占位的組合字元(表情符號除外)。例如,符合

"e" with "é"
"c" with "ç"
"ハ" with "パ"

當選擇忽略不占位的組合字元,例如變音符號、dakuten(日文中的濁點)和 handakuten(日文中的半濁點)選項時,EmEditor 在比較之前將 Unicode 正規化表單 D規范分解)應用於兩個字串,並在比較字串時忽略不占位的組合字元。

忽略 Emoji 數列選項會忽略表情符號數列,數列的第一個程式碼值除外。 例如:

"👨‍🦰" (red hair man, U+1F468 U+200D U+1F9B0) 
and
"👨‍🦳" (white hair man, U+1F468 U+200D U+1F9B3) 

不會被區分。

字串/字元範圍 選項可以最大程度地靈活定義字串的相似程度。例如,如果您指定將連字元「-」視為空格「 」,則不會區分以下兩個字串。

"fuzzy-matching" and "fuzzy matching"

如果您指定要忽略的與號「&」,則不會區分以下兩個字串。

"fuzzy" and "fu&zzy"

您還可以通過選擇 Unicode 腳本、Unicode 一般類別、最小和最大字元程式碼值或這些值的組合來指定字元範圍。例如,如果您指定忽略 Unicode 一般類別「Pc,Pd,Pe,Pf,Pi,Po,Ps」,則字串中的所有標點符號都將被忽略。因此,將不會區分以下兩個字串。

"Emurasoft, Inc." and "Emurasoft Inc"

模糊符合選項對話方塊中提供了更多選項。詳細信息,請參閱說明。

如果您在「尋找」或「篩選」命令中使用模糊符合選項,被模糊符合但不相同的字串會由藍色的擺動下劃線標示。如果您將滑鼠指針停留在這些藍色的擺動下劃線上,未來版本的 EmEditor 將顯示一個工具提示,允許您複製或修復這些模糊符合的字串。

模糊符合選項在尋找取代多檔尋找多檔取代批次尋找批次取代批次多檔尋找批次多檔取代以及合併 CSV對話方塊中使用,另外在尋找篩選工具列上也有對應的按鈕。模糊符合選項目前是全局應用設定,並通過所有這些對話方塊和工具列共享。

如果您在合併 CSV 對話方塊中使用模糊符合選項,您將能夠合併兩個具有相似符合字串的 CSV 文檔。假設您有以下兩個 CSV 文檔:

ID    Company
1     Emurasoft, Inc.
2     Microsoft Corporation
3     Apple Inc.
State    Company
CA       Apple Inc
WA       Microsoft Corp.
WA       Emurasoft Inc

您想以公司名稱來合併這兩個 CSV 文檔。之前版本的 EmEditor 無法正確合併這兩個文檔,因為「Emurasoft, Inc.」與「Emurasoft Inc」不符合。現在,模糊符合讓您能指定要忽略的標點符號,並將「Corp」視為「Corporation」。 因此,結果將變為:

ID    Company                 State   Company
1     Emurasoft, Inc.         WA      Emurasoft Inc
2     Microsoft Corporation   WA      Microsoft Corp.
3     Apple Inc.              CA      Apple Inc

您還可以將模糊符合選項應用於批次尋找批次取代對話方塊中定義的所有搜索字串。要設定或清除所有批次項目的模糊符合選項,請先選取批次清單中的所有項目,右鍵單擊以顯示功能表,您可以在其中切換模糊符合選項。但是,如果您有很多搜索字串或文檔非常大,模糊符合選項會大大地降低搜索速度。

EmEditor v22.0 的其他功能還包括能夠亮顯顯示用於電子郵件報文的頭部多用途互聯網郵件延伸(MIME)編碼的字詞Base64)。例如,如果消息頭部包含以下行:

Subject: =?UTF-8?B?W0VtRWRpdG9yICjjg4bjgq3jgrnjg4jjgqjjg4fjgqPjgr8pXQ==?=
 =?UTF-8?B?IOOCqOODs+OCs+ODvOODieOBruWumue+qeOBq+aXouWumuWIhui/veWKoA==?=

EmEditor 將亮顯顯示這些行,並顯示一個工具提示,如果您將滑鼠指針停留在這些行上,就可以顯示或複製原始字串。

一個使用者要求能夠自訂剪貼簿中字串的貼上方式。如果您從垂直選擇中複製一個字串並將其貼上到純文字中,結果可能與您期望的不完全一樣。在這種情況下,單擊貼上後出現的剪貼簿圖示,在顯示的剪貼簿歷史記錄視窗中右鍵單擊剛剛貼上的字串會快顯一個內容功能表,您可以在其中選擇作為字元插入作為行插入垂直插入作為儲存格插入命令。

預設的功能表經過重新設計,包括了插入轉換書籤排序,以及外掛程式功能表項。如果您的鍵盤不包含專門用於變音字元的鍵,當您需要鍵入這些字元但記不住相應的快速鍵時,插入功能表中的變音符號子功能表會變得很有用,讓您能快速訪問這些命令。希望您喜歡這些變更,但如果您不喜歡,您隨時可以通過工具功能表下的自訂功能表來調整功能表。

v22.0 支持 Unicode 15.0。例如,以下字元是添加到 Unicode 15.0 的新表情符號字元。

🫨 U+1FAE8 (SHAKING FACE)
🩷 U+1FA77 (PINK HEART)
🫎 U+1FACE (MOOSE)
🛜 U+1F6DC (WIRELESS)

雖然需要支持 Unicode 15.0 的字型才能正確顯示上述字元,但將它們複製並貼上到 EmEditor 中,將游標放在每個字元的左側的同時使用字元程式碼值命令 (Ctrl+I) 將顯示其正確的 Unicode 名稱。此更新會影響字元程式碼值命令顯示的 Unicode 名稱Unicode 腳本Unicode 一般類別。它還會影響由東亞寬度字元檢查功能決定的字元寬度。但是,此更新不會影響 Onigmo 規則運算式引擎,該引擎目前仍基於以前版本的 Unicode。

最後,CommitListGit)外掛程式也添加了比較分支的功能以及其他改進,讓此外掛程式更易於使用。

希望您喜歡 EmEditor,無論您使用的是專業版(Professional)還是免費版(Free)。如果您有任何問題、功能請求或想法,請隨時聯繫我們到論壇中留言

感謝您使用 EmEditor!
Yutaka Emura

詳細信息和屏幕截圖,請參閱 EmEditor v22.0 新增功能

此發布還包括了所有在在開發 v22.0 時修復的 bug

如果您使用的是桌面安裝程式版,那您可以到說明功能表下選擇檢查更新來下載最新版本。 如果此方法失敗,請下載最新版本,並運行下載的安裝程式。 如果您使用的是桌面可攜式版,則可以轉到下載頁面下載最新版本。市集應用版可以在幾天後通過 Microsoft 市集更新( 64 位 / 32 位)。

感謝您使用 EmEditor!