Ekstraktor Kolumn Tekstowych
Z łatwością wyodrębniaj pionowe kolumny ze strukturyzowanych danych tekstowych. Idealny do plików dziennika, danych CSV, wartości rozdzielanych spacjami i wyjścia poleceń. Wybierz określone kolumny według numeru, wybierz separatory i natychmiast uzyskaj czyste wyniki.
Blokada reklam uniemożliwia wyświetlanie reklam
MiniWebtool jest darmowy dzięki reklamom. Jeśli to narzędzie Ci pomogło, wesprzyj nas przez Premium (bez reklam + szybciej) albo dodaj MiniWebtool.com do wyjątków i odśwież stronę.
- Albo przejdź na Premium (bez reklam)
- Zezwól na reklamy dla MiniWebtool.com, potem odśwież
O Ekstraktor Kolumn Tekstowych
Witamy w naszym Ekstraktorze Kolumn Tekstowych, potężnym darmowym narzędziu online zaprojektowanym do wyodrębniania określonych pionowych kolumn ze strukturyzowanych danych tekstowych. Niezależnie od tego, czy pracujesz z plikami dziennika, danymi CSV, wyjściem poleceń czy dowolnym tekstem formatowanym kolumnowo, to narzędzie ułatwia izolowanie i wyodrębnianie dokładnie tych danych, których potrzebujesz.
Jak działa wyodrębnianie kolumn
(Wielowierszowy)
separatora
kolumny
separatorem wyjściowym
Kluczowe funkcje
- Obsługa wielu separatorów: Działa ze spacją, przecinkiem, tabulatorem, pionową kreską, średnikiem, dwukropkiem lub niestandardowymi separatorami
- Elastyczny wybór kolumn: Określaj kolumny za pomocą prostej składni, takiej jak
1,3,5lub zakresów, takich jak1-3 - Inteligentna obsługa białych znaków: Separator spacji traktuje wiele spacji/tabulatorów jako pojedynczy separator
- Opcje brakujących kolumn: Wybierz pomijanie linii, używanie pustych ciągów lub wstawianie symboli zastępczych dla brakujących danych
- Personalizacja wyjścia: Formatuj wyjście za pomocą różnych separatorów lub umieść każdą kolumnę w nowym wierszu
- Wizualny podgląd: Zobacz dokładnie, które kolumny są wyodrębniane, dzięki kolorowemu podglądowi
- Statystyki w czasie rzeczywistym: Przeglądaj liczbę wszystkich linii, linii przetworzonych i pominiętych
- Usuwanie białych znaków: Automatycznie czyść dodatkowe spacje z wyodrębnionych danych
Typowe przypadki użycia
1. Przetwarzanie plików dziennika
Wyodrębnij znacznik czasu i typ komunikatu z dzienników serwera. Na przykład z logów takich jak 2025-12-31 10:15:23 INFO User login successful możesz wyodrębnić tylko datę, godzinę i poziom statusu (kolumny 1, 2, 3).
2. Wyodrębnianie danych CSV
Pobierz określone kolumny z danych oddzielonych przecinkami. Jeśli masz duży plik CSV z 20 kolumnami, ale potrzebujesz tylko kolumn 1, 5 i 12, to narzędzie wyodrębni je natychmiast bez otwierania arkusza kalkulacyjnego.
3. Przetwarzanie wyjścia poleceń
Analizuj wyjście narzędzi wiersza poleceń, takich jak ps, ls -l lub netstat. Wyodrębnij tylko identyfikatory procesów, nazwy plików lub numery portów, których potrzebujesz.
4. Wyniki zapytań do bazy danych
Kopiując wyniki zapytania jako tekst, wyodrębnij określone kolumny do raportów lub dalszej analizy.
5. Konwersja formatu danych
Konwertuj między różnymi formatami separatorów. Na przykład skonwertuj wartości oddzielone tabulatorami na oddzielone przecinkami lub wyodrębnij dane oddzielone pionową kreską do formatu oddzielonego spacjami.
Jak korzystać z tego narzędzia
Krok 1: Wklej swój tekst
Skopiuj strukturyzowany tekst i wklej go do pola wejściowego. Każda linia powinna znajdować się w nowym wierszu. Narzędzie obsługuje tekst o dowolnej długości, od kilku linii do tysięcy linii.
Krok 2: Wybierz separator wejściowy
Wybierz znak lub wzorzec, który oddziela kolumny w tekście wejściowym:
- Spacja: Dla tekstu oddzielonego białymi znakami. Ta opcja traktuje dowolną ilość białych znaków (spacje, tabulatory) jako pojedynczy separator.
- Przecinek: Dla plików CSV (wartości oddzielone przecinkami).
- Tabulator: Dla plików TSV (wartości oddzielone tabulatorami).
- Pionowa kreska (|): Popularna w eksportach baz danych i niektórych formatach dzienników.
- Niestandardowy: Określ dowolny znak lub ciąg jako separator.
Krok 3: Określ kolumny do wyodrębnienia
Wprowadź numery kolumn, które chcesz wyodrębnić. Kolumny są numerowane od 1. Możesz użyć kilku formatów:
1- Wyodrębnij tylko kolumnę 11,3,5- Wyodrębnij kolumny 1, 3 i 51-3- Wyodrębnij kolumny 1, 2 i 3 (zakres)1,3-5,7- Kombinacja: wyodrębnij kolumny 1, 3, 4, 5 i 7
Krok 4: Skonfiguruj opcje wyjściowe
Dostosuj sposób formatowania wyodrębnionych danych:
- Separator wyjściowy: Wybierz sposób łączenia wyodrębnionych kolumn (spacja, przecinek, tabulator itp.)
- Pomiń puste linie: Ignoruj puste linie w tekście wejściowym
- Usuń białe znaki: Usuń spacje początkowe/końcowe z każdej kolumny
- Obsługa brakujących kolumn: Co zrobić, gdy linia ma mniej kolumn niż określono (pomiń linię, użyj pustego ciągu lub symbolu zastępczego N/A)
Krok 5: Wyodrębnij i skopiuj
Kliknij przycisk Wyodrębnij kolumny. Narzędzie wyświetli wizualny podgląd pokazujący, które kolumny zostały wyodrębnione z pierwszych kilku linii, statystyki przetwarzania oraz pełny wynik. Skopiuj wynik jednym kliknięciem.
Przykłady składni wyboru kolumn
Podstawowy wybór
1 - Tylko pierwsza kolumna
1,2 - Pierwsza i druga kolumna
1,3,5 - Kolumny 1, 3 i 5
Wybór zakresu
1-3 - Kolumny od 1 do 3 (odpowiednik 1,2,3)
5-10 - Kolumny od 5 do 10
Wybór kombinowany
1,3-5 - Kolumna 1, a następnie kolumny od 3 do 5
1,3-5,7,9-11 - Złożona kombinacja poszczególnych kolumn i zakresów
Zrozumienie separatorów
Separator spacji (tryb inteligentny)
Gdy wybierzesz „Spację” jako separator, narzędzie traktuje każdą sekwencję białych znaków (spacje, tabulatory) jako pojedynczy separator. Jest to idealne rozwiązanie dla wyrównanego tekstu z poleceń, gdzie kolumny są oddzielone różną ilością spacji.
Przykładowe wejście:
Imię Wiek Zawód Miasto Jan 25 Inżynier Warszawa Anna 30 Projektant Kraków
Z separatorem spacji zostanie to poprawnie zinterpretowane jako 4 kolumny mimo różnej ilości spacji.
Inne separatory
Inne separatory, takie jak przecinek, tabulator lub pionowa kreska, są traktowane dosłownie. Każde wystąpienie tworzy nową granicę kolumny, nawet jeśli kolumna jest pusta.
Przykład z przecinkiem:
Jan,Kowalski,25,Inżynier Anna,Nowak,,Projektant
Druga linia ma pustą kolumnę 3 (pomiędzy dwoma przecinkami).
Obsługa brakujących kolumn
Nie wszystkie linie w rzeczywistych danych mają taką samą liczbę kolumn. To narzędzie oferuje trzy strategie:
Pomiń linię, jeśli brakuje kolumny
Jeśli linia nie posiada wszystkich określonych kolumn, cała ta linia jest pomijana w wyniku. Zapewnia to, że Twoje dane wyjściowe zawierają tylko kompletne informacje.
Użyj pustego ciągu znaków
Jeśli brakuje kolumny, w jej miejscu zostanie użyty pusty ciąg znaków. Zachowuje to liczbę linii, ale pozostawia luki w miejscu brakujących danych.
Użyj symbolu zastępczego (N/A)
Brakujące kolumny są wypełniane tekstem „N/A” lub podobnym symbolem zastępczym, co jasno wskazuje na brak danych.
Często zadawane pytania
Co to jest ekstraktor kolumn tekstowych?
Ekstraktor kolumn tekstowych to narzędzie, które wyodrębnia określone pionowe kolumny ze strukturyzowanych danych tekstowych. Rozdziela każdą linię za pomocą separatora (takiego jak spacja, przecinek lub tabulator) i wyodrębnia tylko określone kolumny. Jest to przydatne do przetwarzania plików dziennika, danych CSV, wyjścia poleceń i dowolnego formatu tekstu strukturalnego.
Jak określić, które kolumny wyodrębnić?
Możesz określić kolumny na kilka sposobów: pojedyncze kolumny (1,3,5), zakresy (1-3 dla kolumn 1, 2, 3) lub kombinacje (1,3-5 dla kolumn 1, 3, 4, 5). Kolumny są numerowane od 1. Na przykład, jeśli Twój tekst zawiera Imię, Wiek, Zawód, Miasto, określenie kolumn 1,3 wyodrębni Imię i Zawód z każdej linii.
Jakie separatory są obsługiwane?
Narzędzie obsługuje popularne separatory, w tym spację, przecinek, tabulator, pionową kreskę (|), średnik i dwukropek. Możesz również określić niestandardowy separator dla unikalnych formatów. Separator spacji traktuje dowolne białe znaki (wiele spacji, tabulatory) jako pojedynczy separator, co czyni go idealnym do wyrównanego wyjścia tekstowego.
Co się dzieje, gdy linia ma mniej kolumn niż określono?
Możesz wybrać, jak obsługiwać brakujące kolumny. Opcje obejmują: pominięcie całej linii, jeśli brakuje jakiejkolwiek kolumny, użycie pustego ciągu znaków dla brakujących kolumn lub użycie symbolu zastępczego, takiego jak N/A. Ta elastyczność zapewnia, że narzędzie działa z niespójnymi formatami danych.
Czy mogę tego użyć do plików CSV?
Tak! To narzędzie jest idealne do wyodrębniania określonych kolumn z plików CSV. Po prostu ustaw separator na przecinek, określ kolumny, których potrzebujesz (np. 1,4,7), a narzędzie wyodrębni te kolumny z każdej linii. Następnie możesz je wyprowadzić z innym separatorem, jeśli to konieczne.
Jaka jest różnica między separatorem spacji a tabulatora?
Separator spacji jest „inteligentny” – traktuje dowolną ilość białych znaków (jedna lub więcej spacji, tabulatory) jako pojedynczy separator. Jest to idealne dla wyrównanego wyjścia tekstowego. Separator tabulatora rozdziela tylko przy rzeczywistych znakach tabulacji (\t), traktując każdy tabulator jako dokładnie jedną granicę kolumny.
Czy mogę wyodrębnić kolumny w innej kolejności?
Tak! Kolumny są wyodrębniane w kolejności, którą określisz. Jeśli określisz 3,1,2, wynik będzie zawierał najpierw kolumnę 3, potem kolumnę 1, a na końcu kolumnę 2, zmieniając kolejność Twoich danych.
Jak radzić sobie z danymi w cudzysłowach lub z ucieczkowymi separatorami?
To narzędzie wykonuje proste dzielenie oparte na separatorach i obecnie nie obsługuje separatorów ucieczkowych ani ciągów w cudzysłowach (takich jak pliki CSV, w których przecinki wewnątrz cudzysłowów powinny zostać zachowane). W przypadku złożonego parsowania CSV z cudzysłowami rozważ użycie specjalistycznych narzędzi do przetwarzania CSV.
Czy istnieje limit ilości tekstu, który mogę przetworzyć?
Choć nie ma ścisłego limitu, przetwarzanie bardzo dużych plików tekstowych (setki tysięcy linii) może zająć więcej czasu. Dla optymalnej wydajności narzędzie działa najlepiej z plikami do kilku tysięcy linii. W przypadku ogromnych zbiorów danych rozważ przetwarzanie partiami.
Wskazówki dotyczące skutecznego wyodrębniania kolumn
Najpierw przejrzyj swoje dane
Przed wyodrębnieniem spójrz na pierwsze kilka linii swoich danych, aby zrozumieć, ile jest kolumn i jaki separator jest używany. Wizualny podgląd w wynikach pomaga potwierdzić, że wybrano właściwe kolumny.
Użyj usuwania białych znaków
Włączenie opcji „Usuń białe znaki z kolumn” czyści dodatkowe spacje na początku lub na końcu wyodrębnionych danych, co zapewnia czystsze wyniki, szczególnie podczas pracy z wyrównanym tekstem.
Sprawdź statystyki
Po wyodrębnieniu przejrzyj statystyki pokazujące, ile linii zostało przetworzonych, a ile pominiętych. Jeśli pominięto wiele linii, być może trzeba dostosować strategię obsługi brakujących kolumn.
Łącz z innymi narzędziami
Używaj tego narzędzia w połączeniu z innymi narzędziami do przetwarzania tekstu. Na przykład najpierw wyodrębnij kolumny, a następnie użyj narzędzia do sortowania, usuwania duplikatów lub narzędzia znajdź i zamień do dalszego przetwarzania.
Przykłady z życia wzięte
Przykład 1: Wyodrębnij imiona i wiek z listy kontaktów
Wejście (rozdzielone spacją):
Imię Wiek Zawód Miasto Jan 25 Inżynier Warszawa Anna 30 Projektant Kraków Piotr 28 Programista Gdańsk
Kolumny do wyodrębnienia: 1,3
Wyjście:
Jan 25 Anna 30 Piotr 28
Przykład 2: Analizuj znaczniki czasu dziennika serwera
Wejście (dziennik rozdzielony spacją):
2025-12-31 10:15:23 INFO Logowanie użytkownika udane 2025-12-31 10:16:45 ERROR Błąd połączenia z bazą danych 2025-12-31 10:17:12 WARN Wykryto wysokie zużycie pamięci
Kolumny do wyodrębnienia: 1-3
Wyjście:
2025-12-31 10:15:23 INFO 2025-12-31 10:16:45 ERROR 2025-12-31 10:17:12 WARN
Przykład 3: Wyodrębnij informacje o produkcie z danych oddzielonych pionową kreską
Wejście (rozdzielone pionową kreską):
Produkt001|Widget|49.99|100|W magazynie Produkt002|Gadżet|79.99|50|Niski stan Produkt003|Narzędzie|29.99|200|W magazynie
Separator: Pionowa kreska (|)
Kolumny do wyodrębnienia: 1,2,3
Separator wyjściowy: Przecinek
Wyjście:
Produkt001,Widget,49.99 Produkt002,Gadżet,79.99 Produkt003,Narzędzie,29.99
Cytuj ten materiał, stronę lub narzędzie w następujący sposób:
"Ekstraktor Kolumn Tekstowych" na https://MiniWebtool.com/pl// z MiniWebtool, https://MiniWebtool.com/
przez zespół miniwebtool. Zaktualizowano: 31 grudnia 2025