IT、ガジェットネタまとめ速報

IT技術やガジェットネタに関するみんなの反応のまとめをチョイスしてお届け!

Web系関連記事: プログラミング、開発関連

プログラマーが正規表現を使いこなすメリットとは?

投稿日:

1: ノチラ ★ 2018/06/01(金) 18:00:49.92 _USER
8278index
皆さん、正規表現は使っていますか? 開発者にとってテキスト処理は面倒な場面も多いですが、正規表現を駆使することで一気に効率化することもできます。今回、『正規表現辞典 改訂新版』の著者・佐藤竜一さんに、正規表現を使うメリットや本書についてうかがいました。

――『正規表現辞典 改訂新版』は目的別の検索ができるリファレンスですが、正規表現の歴史や背景についても解説されています。今回は佐藤さんに本書についてお尋ねしますが、まずはご自身のことを教えてください。

佐藤:勤務先はいわゆるSIerですので、各種システムの企画・構築を主業務としています。主に担当しているのは企業向けのアプリケーション開発基盤の構築や、個別システムに対するアプリケーション・アーキテクチャの立案といった分野ですね。

 世間的には「アーキテクト」と呼ばれる職種になりますが、私自身はプログラマーとして個別の問題と向き合い、頭を絞るほうが好きです。

――仕事では正規表現をどう活用されているのでしょうか。

佐藤:個別のアプリケーションにおける入力値検証などに利用することはもちろん、アプリケーションやミドルウェアのトラブルシュートにおけるログの分析や、既存データのクレンジングなどに活用しています。

 ログ分析では必要なログのみを抜き出す、あるいは不要な部分を刈り取るために正規表現は欠かせません。データのクレンジングでは不要なデータを排除する、あるいは不正なデータを正しい形式に整形するといった作業が必要となりますが、このような局面でも正規表現はそのパワーを存分に発揮してくれます。

読みやすさやメンテナンスのしやすさで差がつく
――プログラマー(開発者)として、正規表現を使いこなすのと使いこなさないのとでは、どんな差がつきますか?

佐藤:テキストを相手にする処理では、正規表現を活用することで簡潔かつ分かりやすい記述が可能となるケースが多々あります。正規表現をうまく使えないプログラマーは、ちょっとした処理でもループでテキストを文字単位に分割し、複雑な条件分岐を処理中に記述してしまいます。

 このようなプログラムは確かに動作するかもしれませんが、読みやすさやメンテナンスのしやすさという観点で見れば大きなマイナスとなるでしょう。

「正規表現を使いこなす」という質問からすると拍子抜けされるかもしれませんが、正規表現を使って解決すべき現場の問題の多くは、基本正規表現と拡張正規表現の範囲でも十分まかなえます。

 ですので、本当に基本的な部分をちゃんと理解するだけでもプログラマーとしては大きなアドバンテージになります。大切なのは個々のメタキャラクタの意味をきちんと押さえること、そして実践を繰り返すことでしょう。最初はとっつきにくく見える正規表現も、慣れてくるうちに自然と記述できるようになります。

――開発者以外でも正規表現を使えることでどのような利点がありますか?

佐藤:現在は開発者以外の方でも、各種のクラウドサービスなどのツールやリソースを活用して生産性の向上、さらにはビジネス上の成果を求められる時代です。処理対象の指示や結果の加工に正規表現が必要とされる、あるいは正規表現を使うことでより柔軟な処理を実現できるといった局面は今後も増えてくるはずです。

 たとえば、RPA(Robotic Process Automation)ではExcelやPDFファイルから特定のデータのみを抜き出し、妥当性を判断し、加工したうえで最終的な結果を得るといったことが普通に行われます。このような処理は、それこそ正規表現が最も得意とする領域です。

結果に辿りつく過程を理解してほしい
――2005年に出版された初版と、この改訂版が出る間に、どのような変化がありましたか?

佐藤:本書の前書きにも書きましたが、Unicodeが文字コードの標準的地位を獲得したことです。文字の選択はUnicodeのプロパティにもとづいて行われるため、たとえば1文字の数字を表す「\d」はUS-ASCII以外の数字にもマッチすることが当然になりつつあります。

 また、絵文字のように複数のコードポイントを消費して目に見える1文字を表すケースもこれまで以上に増えました。本書でも可能な限り、これらのポイントについて説明しています。
https://codezine.jp/article/detail/10855

引用元: http://egg.5ch.net/test/read.cgi/bizplus/1527843649/

続きを読む

このまとめの続きはコチラ!

-Web系関連記事: プログラミング、開発関連

関連記事

次世代国産スパコン「富岳」、コロナ対策で活用研究

次世代国産スパコン「富岳」、コロナ対策で活用研究

1: へっぽこ立て子@エリオット ★ 2020/04/07(火) 14:40:13.46 ID:CAP_USER
文部科学省は7日、新型コロナウイルス対策として、次世代の国産スーパーコンピューター「富岳(ふがく)」を活用した研究を始めると発表した。治療薬候補の探索や、ウイルス表面のたんぱく質の…

5G電波飛距離50m、小池百合子東京都知事が改善策発表 「すべての信号機と街頭にアンテナを立てる」

1: キドクラッチ(北海道) [RU] 2019/11/09(土) 17:11:11.98 BE:422186189-PLT(12015)
東京都は8日、次世代通信規格「5G」推進について携帯電話4社の経営トップと意見交換する サミットの初会合を開いた。5G通信網に不可欠な基地局の設置場所として、信号機や街灯など …

女子小学生「プログラミングという言葉も知らない」44.7%

1: ノチラ ★ 2018/04/25(水) 18:03:35.94 _USER
プログラミング教育について、保護者の65.1%は「賛成」と考えているが、女子小学生の44.7%は「プログラミングという言葉も知らない」と答えていることが、KADOKAWAと角川アスキー総合研究所による「子どもライフスタイ…

「VPN」がいまだに使われる理由、今後も残る理由

1: 田杉山脈 ★ 2019/11/01(金) 20:01:45.97 _USER
専用クライアントソフトウェアを利用して接続するクライアントベースのVPN(仮想プライベートネットワーク)は、設定や運用管理に手間がかかり、効率的なデータの送受信を妨げる可能性がある。そのため「クライアントベー…

還暦COBOLはお荷物なのか?

1: 田杉山脈 ★ 2019/03/04(月) 14:52:19.04 _USER
1959年に誕生したプログラミング言語のCOBOL(Common Business Oriented Language)は、2019年で生誕60周年を迎えた。人でいえば還暦や定年に当たり、これから第二の人生を歩んでもおかしくない年数である。このままひっ…