山下 遥, 河原 吉伸
電子情報通信学会技術研究報告 = IEICE technical report : 信学技報 113(476) 109-115 2014年3月6日
大規模なデータを解析する際に,Principal Pointsを用いてデータのいくつかの代表点を求め,その点によってデータを要約するという統計的アプローチは有効な方法である.2値型Principal Pointsは,与えられた多変量2値のデータにおいて,その取り得る2値のパターン中のいくつかの代表的なパターンとして定義される.一般に,2値型Principal Pointを求める計算はNP困難である.本研究では,まずこの問題をp-median問題として定式化し,これに基づく劣勾配法を提案する.これにより厳密解を求めること,または繰り返し計算の途中で解の最適性を評価することが可能となる.さらに本研究では,2値型Principal Pointsおよび提案方法を,実データへ適用し,その有用性について検証する.