文本列提取器
輕鬆從結構化文本數據中提取垂直列。非常適合日誌文件、CSV 數據、空格分隔值和命令輸出。按編號選擇特定列,選擇分隔符,並立即獲得乾淨的結果。
偵測到廣告封鎖,導致我們無法顯示廣告
MiniWebtool 依靠廣告收入免費提供服務。如果這個工具幫到你,歡迎升級 Premium(無廣告 + 更快),或將 MiniWebtool.com 加入允許清單後重新整理頁面。
- 或升級 Premium(無廣告)
- 允許 MiniWebtool.com 顯示廣告,然後重新載入
文本列提取器
歡迎使用我們的文本列提取器,這是一款功能強大的免費在線工具,旨在從結構化文本數據中提取特定的垂直列。無論您是在處理日誌文件、CSV 數據、命令輸出還是任何列格式的文本,此工具都可以輕鬆隔離並準確提取您需要的數據。
列提取的工作原理
(多行)
分割
列
連接
主要特點
- 支持多種分隔符: 適用於空格、逗號、製表符、豎線、分號、冒號或自定義分隔符
- 靈活的列選擇: 使用簡單的語法(如
1,3,5)或範圍(如1-3)指定列 - 智能空白處理: 空格分隔符將多個空格/製表符視為單個分隔符
- 缺失列選項: 選擇跳過行、使用空字符串或為缺失數據插入佔位符
- 輸出自定義: 使用不同的分隔符格式化輸出,甚至可以將每一列放在新行中
- 可視化預覽: 通過顏色編碼的預覽準確查看正在提取的列
- 實時統計: 查看總行數、已處理行數和已跳過行數的計數
- 修剪空白字符: 自動清理提取數據中多餘的空格
常見用例
1. 處理日誌文件
從服務器日誌中提取時間戳和消息類型。例如,從像 2025-12-31 10:15:23 INFO User login successful 這樣的日誌中,您可以僅提取日期、時間和狀態級別(第 1, 2, 3 列)。
2. CSV 數據提取
從逗號分隔的數據中提取特定列。如果您有一個包含 20 列的大型 CSV,但只需要第 1、5 和 12 列,此工具可以立即提取它們,而無需打開電子表格軟件。
3. 命令輸出處理
解析 ps、ls -l 或 netstat 等命令行工具的輸出。僅提取您需要的進程 ID、文件名或端口號。
4. 數據庫查詢結果
將查詢結果複製為文本時,提取特定列以用於報告或進一步分析。
5. 數據格式轉換
在不同的分隔符格式之間進行轉換。例如,將製表符分隔的值轉換為逗號分隔的值,或將豎線分隔的數據提取為空格分隔的格式。
如何使用此工具
步驟 1:粘貼文本
複製您的結構化文本並將其粘貼到輸入字段中。每行應佔一行。該工具可處理任意長度的文本,從幾行到數千行不等。
步驟 2:選擇輸入分隔符
選擇輸入中分隔列的字符或模式:
- 空格: 用於空格分隔的文本。此選項將任意數量的空白字符(空格、製表符)視為單個分隔符,非常適合對齊的命令輸出。
- 逗號: 用於 CSV(逗號分隔值)文件。
- 製表符: 用於 TSV(製表符分隔值)文件。
- 豎線 (|): 在數據庫導出和某些日誌格式中很常見。
- 自定義: 指定任何字符或字符串作為分隔符。
步驟 3:指定要提取的列
輸入您要提取的列號。列從 1 開始編號。您可以使用多種格式:
1- 僅提取第 1 列1,3,5- 提取第 1、3 和 5 列1-3- 提取第 1、2 和 3 列(範圍)1,3-5,7- 組合:提取第 1、3、4、5 和 7 列
步驟 4:配置輸出選項
自定義提取數據的格式:
- 輸出分隔符: 選擇如何連接提取的列(空格、逗號、製表符等)
- 跳過空行: 忽略輸入中的空白行
- 修剪空白字符: 刪除每列開頭/結尾的空格
- 處理缺失列: 當一行的列數少於指定的列數時該怎麼辦(跳過行、使用空字符串或使用 N/A 佔位符)
步驟 5:提取並複製
點擊“提取列”按鈕。該工具將顯示可視化預覽,顯示從前幾行提取的列、有關處理的統計信息以及完整結果。一鍵複製結果。
列選擇語法示例
基本選擇
1 - 僅第一列
1,2 - 第一和第二列
1,3,5 - 第 1、3 和 5 列
範圍選擇
1-3 - 第 1 到第 3 列(等同於 1,2,3)
5-10 - 第 5 到第 10 列
組合選擇
1,3-5 - 第 1 列,然後是第 3 到第 5 列
1,3-5,7,9-11 - 單個列和範圍的複雜組合
了解分隔符
空格分隔符(智能模式)
當您選擇“空格”作為分隔符時,該工具會將任何空白字符序列(空格、製表符)視為單個分隔符。這對於來自命令的對齊文本輸出非常理想,其中列由不同數量的空白字符分隔。
示例輸入:
姓名 年齡 工作 城市 John 25 工程師 NYC Jane 30 設計師 LA
使用空格分隔符,儘管間距不同,這仍會被正確解析為 4 列。
其他分隔符
其他分隔符(如逗號、製表符或豎線)被逐字處理。每次出現都會創建一個新的列邊界,即使該列為空。
逗號示例:
John,Doe,25,Engineer Jane,Smith,,Designer
第二行的第 3 列為空(在兩個逗號之間)。
處理缺失列
在現實數據中,並非所有行都具有相同數量的列。此工具提供三種策略:
如果缺少列則跳過行
如果一行不具備您指定的所有列,則該整行在輸出中將被跳過。這可確保您的輸出僅包含完整數據。
使用空字符串
如果缺少列,則在其位置使用空字符串。這會保持行數,但會為缺失的數據留下空白。
使用佔位符 (N/A)
缺失的列將填充“N/A”或類似的佔位符文本,從而清楚地表明數據缺失。
常見問題解答
什麼是文本列提取器?
文本列提取器是一種從結構化文本數據中提取特定垂直列的工具。它通過分隔符(如空格、逗號或製表符)分割每一行,並僅提取您指定的列。這對於處理日誌文件、CSV 數據、命令輸出和任何結構化文本格式非常有用。
如何指定要提取哪些列?
您可以通過多種方式指定列:單列 (1,3,5)、範圍 (1-3 表示第 1, 2, 3 列) 或組合 (1,3-5 表示第 1, 3, 4, 5 列)。列從 1 開始編號。例如,如果您的文本包含姓名、年齡、職業、城市,指定第 1,3 列將從每行中提取姓名和職業。
支持哪些分隔符?
該工具支持常見的分隔符,包括空格、逗號、製表符、豎線 (|)、分號和冒號。您還可以為獨特的格式指定自定義分隔符。空格分隔符將任何空白字符(多個空格、製表符)視為單個分隔符,使其成為對齊文本輸出理想選擇。
當一行的列數少於指定的列數時會發生什麼?
您可以選擇如何處理缺失的列。選項包括:如果缺少任何列則跳過整行、為缺失列使用空字符串,或使用 N/A 等佔位符。這種靈活性確保該工具能夠處理不一致的數據格式。
我可以將其用於 CSV 文件嗎?
是的!該工具非常適合從 CSV 文件中提取特定列。只需將分隔符設置為逗號,指定所需的列(如 1,4,7),工具就會從每一行中提取這些列。如果需要,您可以使用不同的分隔符輸出它們。
空格分隔符和製表符分隔符有什麼區別?
空格分隔符是“智能”的——它將任意數量的空白字符(一個或多個空格、製表符)視為單個分隔符。這對於對齊的文本輸出非常完美。製表符分隔符僅根據實際製表符 (\t) 進行分割,將每個製表符視為恰好一個列邊界。
我可以按不同的順序提取列嗎?
是的!列按您指定的順序提取。如果您指定 3,1,2,輸出將首先包含第 3 列,然後是第 1 列,最後是第 2 列,從而重新排列您的數據。
如何處理帶有引號或轉義分隔符的數據?
此工具執行簡單的基於分隔符的分割,目前不處理轉義的分隔符或帶引號的字符串(例如應保留引號內逗號的 CSV 文件)。對於帶有引號的複雜 CSV 解析,請考慮使用專門的 CSV 處理工具。
我可以處理的文本量有限制嗎?
雖然沒有嚴格限制,但非常大的文本文件(數十萬行)可能需要更長的時間來處理。為了獲得最佳性能,該工具最適合處理最多幾千行的文件。對於海量數據集,請考慮分批處理。
有效提取列的提示
先預覽您的數據
在提取之前,請查看數據的前幾行以了解有多少列以及使用了哪個分隔符。結果中的可視化預覽有助於確認您選擇了正確的列。
使用修剪空白字符
啟用“修剪列中的空白字符”可以清理提取數據開頭或結尾的多餘空格,從而為您提供更整潔的結果,尤其是在處理對齊文本時。
查看統計信息
提取後,查看顯示已處理行數與已跳過行數的統計信息。如果跳過了許多行,您可能需要調整缺失列處理策略。
與其他工具結合使用
將此工具與其他文本處理工具結合使用。例如,先提取列,然後使用排序工具、重複項刪除器或查找替換工具進行進一步處理。
現實示例
示例 1:從聯繫人列表中提取姓名和年齡
輸入(空格分隔):
John Doe 25 Engineer NYC Jane Smith 30 Designer LA Bob Johnson 28 Developer SF
要提取的列:1,3
輸出:
John 25 Jane 30 Bob 28
示例 2:解析服務器日誌時間戳
輸入(空格分隔日誌):
2025-12-31 10:15:23 INFO User login successful 2025-12-31 10:16:45 ERROR Database connection failed 2025-12-31 10:17:12 WARN High memory usage
要提取的列:1-3
輸出:
2025-12-31 10:15:23 INFO 2025-12-31 10:16:45 ERROR 2025-12-31 10:17:12 WARN
示例 3:從豎線分隔的數據中提取產品信息
輸入(豎線分隔):
Product001|Widget|49.99|100|In-Stock Product002|Gadget|79.99|50|Low-Stock Product003|Tool|29.99|200|In-Stock
分隔符:豎線 (|)
要提取的列:1,2,3
輸出分隔符:逗號
輸出:
Product001,Widget,49.99 Product002,Gadget,79.99 Product003,Tool,29.99
引用此內容、頁面或工具為:
"文本列提取器" 於 https://MiniWebtool.com/zh-tw//,來自 MiniWebtool,https://MiniWebtool.com/
由 miniwebtool 團隊。 更新日期:2025年12月31日