行リストを整理
重複した行をまとめ、昇順/降順ソートや件数カウントをまとめて実行します。
重複カウント
使い方とユースケース
複数行テキストから重複した行を削除し、ソートや件数カウントを行います。次のような場面で役立ちます。
- CSV やログから重複した ID・URL・メールアドレスを除去する
- キーワードリストやタグリストの名寄せ・整理
- SQL の IN 句に渡す値リストから重複を取り除く
- アンケート回答・名簿・商品リストなどの集計前処理
「大文字小文字を区別しない」オプションを使うと Apple と apple を同一行として扱います。処理はブラウザ内で完結するため、大量データも外部送信なしで整理できます。
重複行削除・ソート・件数カウントは、複数行のテキストから重複している行をまとめて取り除き、必要に応じて昇順・降順・数値順などでソートし、削除前後の行数や重複していた値の件数を確認できるツールです。メールアドレスのリストから重複を除きたい運用担当者や、ログファイルから重複した行を整理してユニークなパターンだけを確認したいエンジニアなど、リスト整理が必要な場面で幅広く使えます。入力したテキストはブラウザ内だけで処理され、サーバーには送信されません。
使い方・サンプル・結果例・注意点
使い方
複数行のテキストを入力欄に貼り付け、空行除去・大文字小文字の扱い・ソート順を選んで「整理」を押すと、重複を除いた結果と統計情報が表示されます。
サンプル入力
apple banana apple orange
結果例
「整理」を押すと、apple、banana、orangeの3行(重複したappleの2行目は削除)が結果欄に出力されます。あわせて入力行数は4行、出力行数は3行、削除された重複行数は1行であることが統計として表示され、「重複カウント」欄にはappleが2回出現していたことが示されます。
注意点
「大文字小文字を区別しない」を有効にすると、Appleとappleのような表記違いも同じ行として扱われ重複削除の対象になりますが、その場合は最初に出現した表記(この例ではApple)が代表値として結果に残ります。数値順ソート(数値昇順・数値降順)は、各行の先頭部分などから数値として解釈できる値を基準に並べ替えるため、数値以外の文字列が混在していると意図しない順序になることがあります。
こんなときに使えます
- メールマーケティング担当者が複数のリストを結合した宛先一覧から重複したメールアドレスを取り除き、配信前にユニークなリストへ整える
- サーバーのアクセスログからIPアドレスの一覧を貼り付け、重複を除去してユニークなアクセス元IPアドレスのリストを作成する
- QAエンジニアが複数のテストケースファイルから集めたエラーメッセージの行を重複排除し、発生頻度の高いエラーを件数カウントで把握する
- 商品コードや在庫番号のリストをアルファベット順または数値順にソートしながら重複をまとめて削除し、台帳整理に利用する
- 翻訳作業で使う用語集の候補リストから、表記ゆれを含む重複行を大文字小文字を区別せずに整理する
よくある質問
「数値昇順」を選んだのに、思った順番に並びません。
数値順ソートは各行を数値として解釈できる場合にその値で並べ替えますが、数値として認識できない文字列が含まれる行は末尾や先頭にまとめられるなど、文字列として比較される場合があります。各行が純粋な数値だけになっているか確認してください。
全角と半角の数字や英字は別の行として扱われますか?
はい。全角の「1」と半角の「1」は異なる文字として扱われるため、別の行とみなされ重複削除の対象になりません。表記を揃えたい場合は、全角⇄半角変換ツールで事前に正規化してから本ツールを使うことをおすすめします。
「空行を削除」をオフにするとどうなりますか?
入力に含まれる空行もそのまま1つの行として扱われ、複数の空行があれば重複削除や件数カウントの対象になります。空行ごと残したい場合にオフにしてください。
重複していた行の件数はどこで確認できますか?
結果欄の下にある「重複カウント」セクションに、整理後の結果に対して元の入力で何回出現していたかが行ごとに表示されます。重複がなかった場合はその旨のメッセージが表示されます。