クローリング比較・ランキングサイトの構築【システム構築事例】
価格ドットコムやトリバコの様な形式で複数のサイトから、情報を抽出・表示・比較するクローリングシステム及びサイトの構築を行ないました。
システム概要
①6つの異なるECサイトから特定の情報を抽出
- 抽出情報
- 価格
- 型番
- 商品基本情報
- 画像(抽出元URL同時付与)
- 各商品URL
- カテゴリ
②同一商品情報の判別
商品名または型番で同一商品の判別を行ないました。サイト毎に商品名や商品番号が異なるため、双方の確認を自動で行ない商品ページが重複して生成されない様にしました。
③自動カテゴリー生成
同一商品に紐づいてるカテゴリーを判別し自動で生成。カテゴリー名のルールがサイトによって異なる場合があるので、同一商品で別カテゴリーに紐付いている場合はよりSEO的に強いサイトの優先するように構築しました。
④アフィリエイトURLの自動生成
初期のマネタイズポイントとなるアフィリエイトURLが自動生成する形を構築しました。クローリング対象となるサイトの内アフィリエイトを行っているサイトについてはそれぞれの媒体(A8・バリューコマースなど)で発行されているアフィリエイト用のURLを商品毎に自動生成して、ページ内のリンクに自動的に反映しました。
⑤自動クローリングによる自動更新、自動追加
定期的に対象サイトの自動クローリングを行い、商品情報・追加があった場合は自動的に情報更新・追加します。
⑥商品検索・並べ替え機能
商品数が数10万点に及ぶ為、各カテゴリー、フリーワードでの検索機能を用意。価格・評価・閲覧数順で並び替えも可能にしました。
システム構築後の結果
システム構築から1ヶ月で40万点以上のアイテムの自動登録を実現。SEO戦略もシステム構築時に組み込み、メインキーワード×比較・人気・ランキングなどのキーワードで3ヶ月で上位表示する事が出来ました。
コスト・制作期間
イニシャルコスト:350万円
ランニングコスト:10万円/月(サーバー・保守)
制作期間:3ヶ月(初期のクローリング期間として+1ヶ月)
このシステムのポイント
他社サイトをクローリングさせる場合、サイトによってはクローリングを禁止している場合があるので事前の確認が必要になります。
店舗や商品の”基本情報”の掲載は問題ありませんが、個別の画像・テキストは知的財産にあたるので引用する場合は引用元の掲載が必要になりますので注意してください。
クローリングシステムを始めとするシステム構築もMPH
MPHでは、ビジネスを成功させるためにクローリングシステムを始めとする様々なシステムがからんだホームページの制作も行っております。ご相談は無料ですので、お気軽にお申し付けくださいませ。