2021年度は画像共有SNS(Social Networking Service)から収集した画像データを人力および機械学習手法にてクラスタリングを実施した。その後にクラスタリング結果の観光資源評価への応用可能性について検討した。対象SNSとしてInstagramを取り上げ、徳島県内の観光地・施設を対象に収集・分析を実施した。
第一の成果は人力(目視)によるクラスタリングを実施することで、画像クラスタリングの観光資源評価に対する有用性を評価した点にある。「#徳島観光」にて検索・収集した約700枚の画像の撮影地点を推定し、地図上にプロットすることで観光客の訪問場所・興味を推定することができた。同様に「#祖谷のかずら橋」にて検索・収集した画像から無作為に400枚を抽出し、それらの構図をクラスタリングした。その結果、ガイドブック等に倣った「定番型」と自撮り等を含む「SNS型」に大別することができた。「SNS型」写真を撮影するための場所を適切にPRすることが観光客誘致に有効である点を定量的に示すことができた。
第二の成果はハッシュタグ#大塚国際美術館で検索・収集した画像約3,000枚を機械学習手法により151クラスタに分類した点である。具体の手法はVGG16による各画像の特徴量抽出、t-SNEによる次元削減、DBSCANによるクラスタリングからなる。クラスタリングの的中率は約70%であり、観光資源評価のコスト削減が期待できる。
また主たる目的からはそれるが、SNS投稿文を用いた観光資源評価にも併せて取り組んだ。英語圏にて盛んに活用されている観光ポータルTripAdvisorを用いて日本各地の観光施設に関する投稿文を収集し、これらに対して分析を実施した。今後は投稿画像と投稿文を併せて分析することで、より効果的に観光資源評価が実施できると考えている。