IT、ガジェットネタまとめ速報

IT技術やガジェットネタに関するみんなの反応のまとめをチョイスしてお届け!

Web系関連記事: プログラミング、開発関連

プログラマーが正規表現を使いこなすメリットとは?

投稿日:

1: ノチラ ★ 2018/06/01(金) 18:00:49.92 _USER
8278index
皆さん、正規表現は使っていますか? 開発者にとってテキスト処理は面倒な場面も多いですが、正規表現を駆使することで一気に効率化することもできます。今回、『正規表現辞典 改訂新版』の著者・佐藤竜一さんに、正規表現を使うメリットや本書についてうかがいました。

――『正規表現辞典 改訂新版』は目的別の検索ができるリファレンスですが、正規表現の歴史や背景についても解説されています。今回は佐藤さんに本書についてお尋ねしますが、まずはご自身のことを教えてください。

佐藤:勤務先はいわゆるSIerですので、各種システムの企画・構築を主業務としています。主に担当しているのは企業向けのアプリケーション開発基盤の構築や、個別システムに対するアプリケーション・アーキテクチャの立案といった分野ですね。

 世間的には「アーキテクト」と呼ばれる職種になりますが、私自身はプログラマーとして個別の問題と向き合い、頭を絞るほうが好きです。

――仕事では正規表現をどう活用されているのでしょうか。

佐藤:個別のアプリケーションにおける入力値検証などに利用することはもちろん、アプリケーションやミドルウェアのトラブルシュートにおけるログの分析や、既存データのクレンジングなどに活用しています。

 ログ分析では必要なログのみを抜き出す、あるいは不要な部分を刈り取るために正規表現は欠かせません。データのクレンジングでは不要なデータを排除する、あるいは不正なデータを正しい形式に整形するといった作業が必要となりますが、このような局面でも正規表現はそのパワーを存分に発揮してくれます。

読みやすさやメンテナンスのしやすさで差がつく
――プログラマー(開発者)として、正規表現を使いこなすのと使いこなさないのとでは、どんな差がつきますか?

佐藤:テキストを相手にする処理では、正規表現を活用することで簡潔かつ分かりやすい記述が可能となるケースが多々あります。正規表現をうまく使えないプログラマーは、ちょっとした処理でもループでテキストを文字単位に分割し、複雑な条件分岐を処理中に記述してしまいます。

 このようなプログラムは確かに動作するかもしれませんが、読みやすさやメンテナンスのしやすさという観点で見れば大きなマイナスとなるでしょう。

「正規表現を使いこなす」という質問からすると拍子抜けされるかもしれませんが、正規表現を使って解決すべき現場の問題の多くは、基本正規表現と拡張正規表現の範囲でも十分まかなえます。

 ですので、本当に基本的な部分をちゃんと理解するだけでもプログラマーとしては大きなアドバンテージになります。大切なのは個々のメタキャラクタの意味をきちんと押さえること、そして実践を繰り返すことでしょう。最初はとっつきにくく見える正規表現も、慣れてくるうちに自然と記述できるようになります。

――開発者以外でも正規表現を使えることでどのような利点がありますか?

佐藤:現在は開発者以外の方でも、各種のクラウドサービスなどのツールやリソースを活用して生産性の向上、さらにはビジネス上の成果を求められる時代です。処理対象の指示や結果の加工に正規表現が必要とされる、あるいは正規表現を使うことでより柔軟な処理を実現できるといった局面は今後も増えてくるはずです。

 たとえば、RPA(Robotic Process Automation)ではExcelやPDFファイルから特定のデータのみを抜き出し、妥当性を判断し、加工したうえで最終的な結果を得るといったことが普通に行われます。このような処理は、それこそ正規表現が最も得意とする領域です。

結果に辿りつく過程を理解してほしい
――2005年に出版された初版と、この改訂版が出る間に、どのような変化がありましたか?

佐藤:本書の前書きにも書きましたが、Unicodeが文字コードの標準的地位を獲得したことです。文字の選択はUnicodeのプロパティにもとづいて行われるため、たとえば1文字の数字を表す「\d」はUS-ASCII以外の数字にもマッチすることが当然になりつつあります。

 また、絵文字のように複数のコードポイントを消費して目に見える1文字を表すケースもこれまで以上に増えました。本書でも可能な限り、これらのポイントについて説明しています。
https://codezine.jp/article/detail/10855

引用元: http://egg.5ch.net/test/read.cgi/bizplus/1527843649/

続きを読む

このまとめの続きはコチラ!

-Web系関連記事: プログラミング、開発関連

関連記事

シンギュラリティー「ノストラダムスと一緒」新井教授

1: 田杉山脈 ★ 2019/08/21(水) 20:15:25.03 _USER
進化する人工知能(AI)に雇用を奪われないように、子どもたちに読解力をつける取り組みを進めている国立情報学研究所の新井紀子教授(56)に「AI時代の教育」について尋ねた。  ――AIにできること、できな…

人生に「遅い」はない 80代のプログラマー、探求なお

1: 田杉山脈 ★ 2019/11/16(土) 18:29:51.65 _USER
81歳でiPhoneのアプリを開発し「世界最高齢のプログラマー」と呼ばれた女性がいる。若宮正子さん(84)だ。「シニアにこそ情報技術(IT)を使ってほしい」という思いから、国内外での講演や本の執筆など活動の幅を広げ、…

AIが「コミュ力」採点、NTTデータ 富国生命などが採用検討

1: 田杉山脈 ★ 2018/07/30(月) 01:11:36.34 _USER
NTTデータは対面営業での「コミュニケーション能力」を人工知能(AI)で診断するシステムを開発した。営業担当者の表情や身ぶり、話し方をAIが分析し、相手に与える親しみやすさなどの印象を採点する。ロールプレ…

機械学習を用いると匿名のソースコードから個人を識別可能であることが判明

1: 田杉山脈 ★ 2018/08/13(月) 17:24:20.61 _USER
プログラミング言語を用いて書かれた「ソースコード」はあらかじめ定められた規則に従って記述する必要があり、匿名で公開されたコードから個人を識別することは困難に思えるかもしれません。ところが、実際にはコードに…

2019年版「最初に学ぶにはふさわしくないプログラミング言語」リスト

1: 田杉山脈 ★ 2019/10/12(土) 19:24:00.84 _USER
最悪のプログラミング言語や最高のプログラミング言語を決める絶対的な基準はないが、需要が旺盛でコミュニティーが活発な言語を学びたいなら、選ぶべき言語とそうでない言語がある。  Codementorが、開発者や企業の…