Toshiba  東芝電子エンジニアリング    サイトマップ サイトマップ お問い合わせ お問い合わせ
トップページ > 事業紹介 > 機械学習
 
コンセプト
コンサルティング
データ解析
- イノベーション活動
- データ解析
- ツール導入
機械学習

機械学習
に関するご相談・
お問い合わせはこちら TEL:045-770-3371
お電話受付9:00-17:00平日

WEBからのお問合せ

 

 

 

 

 

 

 

 

 

 

東芝電子エンジニアリング株式会社は2019年4月1日をもちまして
東芝デベロップメントエンジニアリング株式会社と統合致しました。
東芝デベロップメントエンジニアリング株式会社のサイトはこちら>


 
  当社の機械学習の取り組みをご紹介いたします  

 

現実問題と機械学習

機械学習を活用した業務改善事例を、最近頻繁に目にするようになりましたが、医療、金融、マーケティング、 セキュリティの分野が多いようです。はたして、モノづくりや社会インフラの分野で、機械学習は役立つのでしょうか。
限られた観測データだけで結果を出してしまう機械学習は、不安定な挙動を示す現実の問題に適用してもその解決にはつながらないというのが一般的な見方です。当社で実践した多くの事例でも、参考情報は提示されるが、要因の解明、特性の予測は困難というものでした。
しかし、試行を繰り返す中で、様々な工夫を加えることで、利用シーンによっては大きな効果が出せることもわかってきました。


半導体工場におけるデータ活用への貢献

当社が永年関わってきている半導体事業では、日々の意思決定の質とスピードを高めるため、データ活用力がますます重要になってきています。大容量データの蓄積・検索・分析のための環境構築が進み、生産管理、品質管理、装置・プロセス管理など、従来は人が行っていた業務に機械(コンピュータ)にも加わってもらう活動が進行中です。当社では、従来の統計手法では限界があった分類や特性予測の問題に機械学習を適用することにより、解析作業の自動化と向上を実現しています。

 

半導体工場における解析の自動化

データ解析業務に機械学習を組み込む場合、予測モデル構築とモデル評価に加え、 汎化性能評価が必ず入るため、データの取り込みから解析レポート出力までの手順をフローチャート(下図は一例)で示すと解析の流れが理解しやすくなります。機械学習を適用する場合、このようなデータ処理のフロー図を描きながら予測モデルの評価を何度か行い、より優れた解析ツールに仕上げていきます。
半導体工場のように行数、列数とも巨大なデータを扱う場合、クライアントPCで処理することは困難なため、基幹システム上のサーバーで機械学習のアルゴリズムを実行することが一般的です。解析の自動化にあたっては、工場の情報システム部門との連携が不可欠で、当社の技術者も関係部門との協業で大規模並列分散処理を実行し、解析能力を強化しています。

▲ ページのトップへ戻る

機械学習が役立つ場面

機械学習が最近注目されている理由は、二つあると思います。一つは、インターネットやIoTの進展により、データ量が爆発的に増大していることと、もう一つは、CPU/GPUやサーバの処理能力の増大で、安価にデータ処理ができることが大きな要因です。
これまでは、少量データに対して、人がクレンジングし、処理していた形態が、大量データに対し、一定ルールに基づき自動的に加工し、処理する形態に変わってきています。人は、判断に集中することが可能になってきています。現在は、分類(Classification)、回帰(Regression)、クラスタリング等の処理が自動化できる環境に変化しています。
また、深層学習の開発が大きく進み、画像や音声といったパタン認識の質が大きく向上しています。これらの技術は、これまで人間でしかできないと考えられていた自動運転や、音声認識・音声合成の分野を大きく変えようとしています。
仕事の中にこれらの技術を導入をチャレンジする時期がまさに到来しています。


ソフトウェア

機械学習のソフトウェアは日々進化していますので、動向を常にチェックし、最適なソフトウェアを選ぶのが良いようです。比較的小規模のデータを自分のPCで分析する場合は、適当なフリーソフトや機能を絞った無償版が提供されています。
あまり費用をかけず利用者を増やすことが目的であれば、無償のソフトウェアが候補になりますが、現実に起こっているビジネス上の問題に対応する場合には、市販のパッケージソフトを導入すべきと考えます。計算結果や速度に対するサポート・教育体制や、システム化等の拡張性に優れています。また、最先端の解析機能の利用と、操作性が改善されたが最新バージョンが利用できるため、分析者の業務効率が向上します。
当社では、機械学習を活用するための分析基盤として、TIBCO StatisticaTIBCO Spotfireを推奨しています。
いずれの製品も、データベースと接続し、連携しての分析が可能であり、また、統計解析の無償のソフトウェア(R等)と連携しての分析も可能です。
TIBCO Statisticaは、データマイニング、機械学習の機能が充実しており、分析の流れをビジュアル化するワークフローや、VisualBasic、Pythonといった汎用言語で分析を記述することも可能であり、分析の再利用が容易になっています。
TIBCO Spotfireは、可視化に優れています。

  → ソフトウェア詳細 Statistica spotfire

TIBCO Statistica 分析例

機械学習ワークフロー

statistica

mass

   

TIBCO Spotfire 分析例

   スクリプト   
   spotfire解析例
   

▲ ページのトップへ戻る