Duplicaten verwijderen
Plak een lijst en verwijder alle duplicaten direct.
Wat is een tekst-deduplicatietool?
Een tekst-deduplicatietool verwijdert dubbele regels of items uit een tekstlijst. Handig voor het opschonen van e-maillijsten, datasets, logbestanden en elke lijst met herhalingen.
Deduplicatie kan hoofdlettergevoelig of -ongevoelig zijn, witruimte negeren en de oorspronkelijke volgorde behouden of de lijst sorteren.
Hoe gebruikt u deze tool?
Plak uw lijst (รฉรฉn item per regel) in het invoerveld. De tool verwijdert duplicaten en toont de opgeschoonde lijst. Kies opties: hoofdlettergevoelig, witruimte trimmen, sorteren.
Opties
- Hoofdlettergevoelig โ 'Appel' en 'appel' worden als verschillend behandeld.
- Witruimte trimmen โ spaties voor en na elke regel verwijderen voor vergelijking.
- Lege regels verwijderen โ alle blanco regels uit het resultaat verwijderen.
- Volgorde behouden โ het eerste voorkomen van elke waarde blijft op zijn oorspronkelijke positie.
Veelvoorkomende toepassingen
E-maillijsten opschonen voordat nieuwsbrieven worden verzonden (dubbele e-mails verspillen verzendquota en irriteren ontvangers). Zoekwoordlijsten dedupliceren voor SEO-onderzoek. Dubbele invoer verwijderen uit CSV-bestanden of spreadsheetdata. Logbestanden opschonen om unieke foutmeldingen te vinden. Lijsten uit meerdere bronnen samenvoegen tot รฉรฉn unieke lijst.
Veelgestelde vragen
Hoe werkt deduplicatie bij grote lijsten?
De tool gebruikt een Set-datastructuur voor O(1) opzoektijd per item. Een lijst van 100.000 regels wordt binnen milliseconden verwerkt in de browser. Voor zeer grote bestanden (miljoenen regels): gebruik opdrachtregelhulpmiddelen zoals sort -u of awk.
Kan ik duplicaten op basis van een specifieke kolom verwijderen?
Deze tool vergelijkt volledige regels. Voor kolomgebaseerde deduplicatie in CSV-bestanden: gebruik een spreadsheetprogramma (pivot tabel, UNIEK-functie) of opdrachtregelhulpmiddelen: awk -F, met gezien-array.