正規表現の基本記法(チートシート)
| 記法 | 意味 | 例 |
|---|---|---|
| \d | 数字1文字 | \d{3} は数字3桁 |
| \w | 英数字とアンダースコア | \w+ は単語 |
| . | 任意の1文字 | a.c は abc, axc 等 |
| + / * | 1回以上 / 0回以上の繰り返し | \d+ は1桁以上の数字 |
| ? | 0回または1回 | https? は http と https |
| [ ] | 文字の範囲・候補 | [ぁ-ん] はひらがな1文字 |
| ^ / $ | 先頭 / 末尾 | ^\d+$ は全体が数字 |
| ( | ) | グループ・または | (jpg|png) はどちらか |
このツールの使い方
- テンプレートを選ぶ:用途に近いテンプレートをクリックすると、パターンとサンプル文が入力されます。
- テスト文字列を貼る:実際のデータを貼り付けると、マッチ箇所が黄色でハイライトされます。
- パターンを調整:構文エラーは即座に赤色で表示されます。
- コードをコピー:JavaScriptでの使用例をそのままコピーできます。
日本語特有のポイント
- ひらがな:
[ぁ-ん]、全角カタカナ:[ァ-ヶ]。長音「ー」は範囲外なので必要なら明示的に追加します。 - 全角と半角は別の文字です。全角数字「123」は
\dにマッチしません。 - 漢字は
[一-龠]で大半を表せます。Unicodeプロパティ\p{Script=Han}という書き方もあります(uフラグが必要・本ツールのフラグ欄は g/i/m のみのためツール上では試せません)。
よくある間違い
- gフラグの付け忘れ:最初の1件しかマッチせず「動かない」と誤解する原因の筆頭です。
- . (ドット)のエスケープ漏れ:URLやファイル名の「.」は
\.と書かないと任意の1文字になります。 - ^$なしの検証:入力チェックでは
^…$で全体一致にしないと「一部だけ合致」でも通ってしまいます。
よくある質問(FAQ)
正規表現とは何ですか?
文字列のパターンを表す記法です。例えば \d{3}-\d{4} は「数字3桁、ハイフン、数字4桁」(郵便番号の形)を意味します。入力チェック・検索置換・データ抽出など、プログラミングやスプレッドシート、SEOツールの設定など幅広い場面で使われます。
テンプレートはそのまま実務に使えますか?
一般的な用途を想定した実用版です。ただし、例えばメールアドレスの完全な仕様(RFC 5321/5322)を正規表現で表すのは非現実的なため、簡易版を採用しています。厳密さが必要な場面では要件に合わせて調整してください。
g・i・mフラグの意味は?
g(global)は文字列の最後まですべてのマッチを探します(ないと最初の1件のみ)。i(ignoreCase)は大文字小文字を区別しません。m(multiline)は ^ と $ が各行の先頭・末尾にも一致するようになります。
ひらがな・カタカナの判定はどう書きますか?
ひらがなは [ぁ-ん]、全角カタカナは [ァ-ヶ] の文字範囲で表せます。長音記号「ー」を含める場合は [ぁ-んー] のように追加します。本ツールのテンプレートにどちらも含まれています。
マッチするのに置換や抽出がうまくいきません。
gフラグの有無を確認してください。gなしでは最初の1件しか対象になりません。また、ツール上でのマッチ確認はJavaScriptの正規表現エンジンで行っているため、他の言語(Python等)では一部の高度な記法の挙動が異なる場合があります。
このツールは無料ですか?入力した内容は送信されますか?
完全無料・登録不要です。パターンの実行はすべてブラウザ内で行われ、入力した文字列がサーバーに送信されることはありません。
データ整形つながりでは 日本語スラッグジェネレータ、計測タグの整備には dataLayerスニペット生成ツール もご利用ください。