ホーム " ソーシャル・スパムの検知と対策技術の最新動向

ソーシャル・スパムの検知と対策技術の最新動向

2023年3月12日 • セキュリティ

Spam refers to unwanted or unsolicited messages sent or received electronically via email, instant messaging, blogs, newsgroups, social media, web search, and mobile phones, with advertising fines, Phishing, Malware, etc. As is clear from the definition, Spam is intended for malice and generally represents a viable but fraudulent source of income for some individuals or organizations. The cyber attacker involved in sending such spam messages is generally referred to as a “spammer.” Although initially targeted and limited to email, spam has invaded all electronic platforms in all media.

今日存在するスパムの種類は何ですか?

  • メールスパム: ジャンクメールとも呼ばれ、商業的な内容を含むことが多い不要なメッセージを、大量に無差別な受信者に送信します。.
  • インスタントメッセージングでのスパムはインスタントメッセンジャー(IM)を使用します: メールスパムほど目立たないものの、Skype©、Yahoo!®、Messengerのようなインスタントメッセンジャーのユーザーを広告主などからの迷惑メッセージで苛立たせる傾向があります。.
  • ニュースグループやフォーラムでのスパム: Usenetニュースグループや無関係なインターネットフォーラムでの複数回の繰り返し投稿。.
  • 携帯電話スパム: この形式のスパムはショートメッセージサービス(SMS)を使用します。時には、顧客が偽のサブスクリプションや詐欺に引っかかってプレミアムサービスの料金を請求されることがあります。.
  • スパムデキシング: 検索エンジンスパム、または特定のウェブサイトやウェブページを宣伝するために検索エンジンのランキングと関連性アルゴリズムを操作する行為を指します。.
  • スプログとウィキ: ブログでのスパム、スプログとも呼ばれ、議論のトピックに関係のないコメントを指します。これらのコメントは通常、商業サイトへのURLリンクが埋め込まれています。いくつかのスプログは、宣伝するウェブサイトの詳細な発表として書かれていますが、他のものは無意味な内容や正当なウェブサイトから盗まれた内容を特徴としています。ウィキや一般ユーザーからのコメントを受け付ける他のゲストブックでも同様の攻撃が見られます。.
  • 動画サイトでのスパム: YouTubeのようなソーシャルネットワーキングサイトも、ポルノサイトやデートサイト、無関係な動画へのコメントやリンクを含むスパムに悩まされています。これらのコメントは時々ボットによって自動生成されます。.
  • オンラインゲームのメッセージングでのスパム: 特定のグループへの参加リクエスト、著作権条件の違反などのメッセージの洪水。.
  • インターネット電話でのスパム(スピ): これはインターネット電話(VoIP)を使用してスパムを送信します。通常、受信者が誤ってスパムコールを受け取ると、事前に録音されたメッセージが再生されます。このプラットフォームは、VoIPが安価で簡単に匿名化できるため、スパマーにとって脆弱なターゲットです。.

スパムの種類とスパム技術

スパムの種類

  • 悪意のあるリンク: Links that harm, mislead, or otherwise harm a user’s computer.
  • 偽のプロフィール: スパマーは、検出を避けるために一見正当な偽のプロフィールを作成し、非スパマーを友達に誘い込むことがあります。.
  • 大量メール送信: スパムボムとして知られており、同じテキストを何度も公開するコメントのセットであり、コメントに関連付けられたタグがソーシャルネットワークで急速にトレンドになることを可能にします。.
  • 詐欺レビュー: これらのレビューは、レビュアーが実際に使用していないにもかかわらず、製品がオリジナルで良いと主張します。.

スパム技術

  • クリックジャッキング: 別名 UIリドレッシング, 、スパマーはユーザーを異なるページに属する見えないターゲット(例:ボタン)をクリックするように騙します。この形式のスパムは主にブログやフォーラムで見られます。.
  • ドライブバイダウンロードによる悪意のあるブラウザ拡張機能: This form of attack occurs by downloading malware from the Internet without the user’s notice. This type of spam usually comes as malicious links and can be found on blogs, website bookmarks, reviews, etc.
  • URL短縮: In this spam attack, the shortened URL obfuscates the actual URL and redirects to its configured destinations without the user’s consent. This type of spam is more frequent in social networks, microblogs, reviews, etc.
  • ソーシャルエンジニアリングスクリプト注入: In this attack, end-users are tricked into executing malicious JavaScript code of the spammer’s choice in the context of the victim’s site, thereby attacking users’ trust. Again, this attack is often associated with obscure links to malicious programs or websites. It may appear as forms on some review websites, such as emails.

スパム検出技術

スパムに対処するための主な戦略は3つあります:

  • 検出ベースの技術:これらはシステムからスパムを識別して削除しようとします。.
  • 劣化ベースの戦略:これらはメッセージリスト内のスパムのランキングを下げようとします。.
  • 予防ベースの戦略:これらはインターフェースを変更したりユーザーの行動を制限することでスパマーがシステムに貢献する能力を妨げることを目的としています。.

最新のアンチスパム技術の発展

Eメールスパム

ソーシャルネットワークを通じて協調フィルタリングが使用されており、SocialFilterと呼ばれる協調スパムフィルタリングシステムは、オンラインソーシャルネットワーク(OSN)に統合されたソーシャルトラストを使用して オンラインソーシャルネットワーク (OSN)を評価します スパム報告者の信頼性. 。これはOSNグラフに基づいたグラフベースのアプローチです。SocialFilterは、複数のスパム検出器の機能を追加し、スパム緩和を民主化することを目指しています。各SocialFilterノードは人間の管理者によって管理され、スパマーの報告を中央リポジトリに送信します。.

ブログスパム

ブログは、人々が感情を表現し、情報を共有し、コミュニケーションするプラットフォームです。その人気の高まりとともに、ブログはブログ検索エンジントラフィックを促進したり、宣伝目的で使用されるようになりました。これらのタイプのブログはスプログと呼ばれます。しかし、既存のスプログ検出技術のほとんどはコンテンツベースであり、ブログの動的な性質を考えると効果が低いです。.

現在、スプログと戦うために使用されている3つのアンチスパム技術があります:

  1. 決定論的アプローチを使用する検出ベースの技術は、Technoratiクエリデータセットを使用し、検出精度が60%を超えています。.
  2. ソーシャルネットワークのコメントを通じて動作する分類ベースの技術は、検出精度が60%を超えています。.
  3. 商業ブログサイトでの投稿を使用したグループ化されたソーシャルグラフを使用する検出ベースの技術。この技術はスパマーを検出するのに最も効率的とされています。.

マイクロブログスパム

マイクロブログスパムは、Twitterのようなマイクロブログプラットフォームでのスパムを指し、ツイートのサイズに制限があります。マイクロブログスパムを検出するために、いくつかの技術が利用可能です:

  1. ケーススタディを研究してスパムを識別する決定論的アプローチ。.
  2. ソーシャルハニーポットフレームワークに焦点を当てた分類ベースのアプローチ。.
  3. Collusion RankとPageRankに焦点を当てた劣化技術。.

ケーススタディと分類を組み合わせたアンチスパム技術もあり、 ソーシャルグラフベースのMr. SPA, 、スパムキャンペーンのクラスタリングとRF Classifierを使用したラベリング、グラフ正則化項と統合されたLassoフォーミュレーション、調整された特徴を使用したランダムフォレスト分類、定義された特徴を持つELMベースの分類器などの技術があります。.

ブックマークスパム

ソーシャルブックマークは、伝統的なブックマークから、ユーザーがウェブサイトやウェブページを追加、編集、または修正して将来アクセスできるプラットフォームに進化しました。これらのサイトは、ユーザーが異なるウェブページをブックマークし、記事、画像、動画に対する意見を共有することを許可します。しかし、多くのウェブサイト所有者は、興味深い記事を閲覧し、リンクを含めるためにソーシャルブックマークサイトを使用します。これにより、スパマーが魅力的なスパムブックマークを作成し、無防備なユーザーに選ばれることで、ウェブサイトがスパマーにさらされます。.

ブックマークスパムと戦うために、さまざまなアンチスパム技術が利用可能です:

  1. 自己組織化マップ(SOM)クラスタリングと関連発見に基づくクラスタリングと分類技術。.
  2. 確率的特徴抽出と集約。.
  3. 特徴抽出のためのGraphLab Createと確率的ソフトロジック。
  4. 分類のための勾配ブースト決定木分類器。.

ソーシャルネットワークスパム

現在のアンチスパム技術は、ソーシャルネットワークスパムの生成者がロボットであることを特定しました。これらのロボットは、ディスプレイヤー、ブラッガー、ポスター、ウィスパラーとして知られています。ソーシャルネットワークのアンチスパム技術には以下が含まれます:

  • FF比率:友達リクエストの数と既存の友達の数の比率。.
  • URL比率:メッセージ内のURLの数と単語数の比率。.
  • Friend choice: The similarity between the spammer and the victim’s friend lists.
  • 送信されたメッセージ:特定の時間枠内でユーザーが送信するメッセージの数。.
  • 友達の数:ユーザーが持っている友達の数。.

言い換えれば、これらはスパムボットとスパムプロフィールに基づく分類技術であり、実行時分類です。クラスタリング技術は、ソーシャルグラフ上のマルコフクラスタリングに焦点を当て、 SOM学習アルゴリズム, 、検出と削除技術は、分類に続くインクリメンタルクラスタリングに基づいています。分類と監視技術は、ソーシャルネットワークベースのSocial Spam Guardに焦点を当て、教師なし検出技術は HITSベースのフレームワーク.

レビュースパム

Review Spam is a type of spam that appears as reviews on various e-commerce websites. Positive reviews can boost a company’s business, but negative reviews can harm it. Some spammers intentionally 製品や会社の評判を損なうためにレビューを投稿する, 、そしてロボットもこれらのレビューを生成することができます。2013年には、合成レビューを生成するモデルが設計されました。既存の方法では検出が難しい偽レビューと真実のレビューの意味的フローの違いを検出するための新しい防御方法が提案されました。.

現在、レビュースパムを検出するためのいくつかのアンチスパム技術があります:

  • 線形カーネルSVMとn-gramベースの方法に焦点を当てた分類ベースの技術。.
  • ルールベースの技術。.
  • 時間に敏感な特徴ベースの技術。.
  • 分類とクラスタリングのフレームワークに基づく統合技術。.
  • 合成レビューの生成と分析に焦点を当てた分類ベースの技術。.
  • ループ信念伝播(LBP)ネットワークベースの技術。.

位置検索スパム

サイバーセキュリティの研究によれば、スパマーは無関係なタグを文書に関連付けたり、特定の場所に関連する用語をランダムに注入することで、有効な検索システムに侵入して混乱させることができます。この問題に対処するために、位置ベースのソーシャルブックマークサイト、Foursquareでのスパムを検出するための方法論が開発されました。Foursquareは、ユーザーがさまざまな場所やアトラクションについてのヒントを残すことができ、他のユーザーがアクセスできます。しかし、スパマーは無関係なコンテンツ、例えばビジネスヒントを投稿し、特定の場所について知りたいユーザーを誤解させます。.

この文書は、スパム提案を投稿するユーザーを検出するための自動化ツールを開発することを目的とした提案スパマーを分析します。位置検索アンチスパム技術は、ランダムフォレストと決定木に基づく分類に焦点を当てた分類とクラスタリングに基づいており、, EMクラスタリング による分類とランダムフォレスト分類。.

コメントスパム

コメントスパムは、特にYouTubeやニュースサイトのソーシャルメディアプラットフォームで広まっています。このサイバー攻撃と戦うために、YouTubeフォーラムでのスパムコメントをフィルタリングするためのデータマイニングアプローチが提案されました。スパム検出のためのコンテンツ分析とは異なり、このアプローチはスパマーを特定するためにコメントの行動を利用します。この方法論は、ユーザーコメントに伴う YouTube’s hasSpamHint feature を利用します。以下は関与するステップです:

  1. 特定の動画に対してhasSpamHintとマークされたコメントを取得します。.
  2. 疑わしいスパムコメントの背後にあるユーザーIDを抽出し、ユーザーのコメント活動に関する情報を収集します。.
  3. コメントテキスト、タイムスタンプ、コメントされた動画のVideoID、ディスカッションフォーラムの使用ログからのhasSpamHintバイナリ変数の値などの属性を導出します。.
  4. ユーザーのスパム意図を示す変数の値を計算します。.
  5. ユーザーにスコアを割り当て、スパマーかどうかを識別します。.
  6. Apply a specific rule derived from manual data inspection to mark any user who meets the rule’s conditions (with at least five comments) as a spammer.

このアンチスパム技術は、ルールベースで 自然言語処理によるトピック類似性 を投稿やコメントに続いて分類するものです。.

クロスメディアスパム

クロスメディアスパムは、異なるプラットフォームでスパムを検出する独自のアンチスパム方法論です。これは、すべてのソーシャルネットワークでのスパムの迅速な特定と、大規模なデータセットの参加によるスパム検出精度の向上を含みます。単一の効果的な戦略をすべての形式とプラットフォームのスパムに適用することはできませんが、この技術はソーシャルスパムを検出するための革新的なクロスプラットフォームフレームワークです。.

この技術は3つの主要なコンポーネントに分かれています:

  1. マッピングとアセンブリは、特定のソーシャルネットワークオブジェクトをフレームワークで定義された標準モデルに変換することを使用します。.
  2. 事前フィルタリングは、ブラックリスト、ハッシュ、類似性比較に基づいて、既知のスパムオブジェクトと受信オブジェクトを比較します。.
  3. 分類は、受信および関連オブジェクトを分類するために教師あり機械学習技術に基づいています。.

結論

スパムはインターネット上で広範な問題であり、さまざまなプラットフォームでさまざまな成功度でアンチスパム技術が開発され実装されています。これらの技術は大まかに決定論的、確率的、またはグラフベースのアルゴリズムに分類されますが、各カテゴリには大きなバリエーションがあります。確率的アプローチは、ソーシャルネットワークの特性が標準の文書やウェブページとは大きく異なるため、現代の技術で最も一般的に使用されています。しかし、スパマーが検出を回避する新しい方法を開発するため、スパムとの戦いは終わりのないゲームです。.

したがって、スパムを効果的に戦うためには、絶え間ない警戒と新しくより良いスパム対策技術の開発が不可欠です。.

著者アバター

セキュリティ

ガバメント・テクノロジー誌のシニア・スタッフ・ライター。以前はPYMNTSとThe Bay State Bannerに寄稿し、カーネギーメロン大学でクリエイティブ・ライティングの学士号を取得。ボストン郊外に拠点を置く。

jaJapanese