Home " Recente ontwikkelingen in detectie- en bestrijdingstechnieken voor sociale spam

Recente ontwikkelingen in detectie- en bestrijdingstechnieken voor sociale spam

12 maart 2023 - beveiliging

Spam refers to unwanted or unsolicited messages sent or received electronically via email, instant messaging, blogs, newsgroups, social media, web search, and mobile phones, with advertising fines, Phishing, Malware, etc. As is clear from the definition, Spam is intended for malice and generally represents a viable but fraudulent source of income for some individuals or organizations. The cyber attacker involved in sending such spam messages is generally referred to as a “spammer.” Although initially targeted and limited to email, spam has invaded all electronic platforms in all media.

Welke soorten spam bestaan er tegenwoordig?

  • E-mail spamOok bekend als junkmail, stuurt ongewenste berichten, vaak met commerciële inhoud, in grote hoeveelheden naar een willekeurige groep ontvangers.
  • Spam in instant messaging maakt gebruik van instant messengers (IM): Hoewel het subtieler is dan zijn tegenhanger in e-mail, irriteert het gebruikers van instant messengers zoals Skype©, Yahoo!® en Messenger met ongevraagde berichten van adverteerders, enz.
  • Spam op nieuwsgroepen en forums: het veelvuldig en herhaaldelijk posten in Usenet nieuwsgroepen en irrelevante internetforums.
  • Mobiele telefoon spam: Deze vorm van spam gebruikt short message services (SMS) als modus operandi. Soms moeten klanten betalen voor premium services door te worden misleid tot een nepabonnement en -zwendel.
  • Spamdexing: verwijst naar zoekmachinespam of de praktijk van het manipuleren van het rangschikkings- en relevantiealgoritme van zoekmachines om een bepaalde website of webpagina te promoten.
  • Splogs en wiki's: Spam op blogs, ook bekend als Splog, verwijst naar commentaren die niets te maken hebben met het discussieonderwerp. Deze commentaren zijn meestal ingebed met URL-links naar commerciële sites. Sommige Splogs zijn geschreven als gedetailleerde aankondigingen voor de websites die ze promoten; andere hebben geen originele inhoud en bevatten onzin of inhoud die gestolen is van legitieme websites. Gelijksoortige aanvallen worden ook gezien op Wiki's en andere gastenboeken die commentaar van algemene gebruikers accepteren.
  • Spam op videosites: Sociale netwerksites zoals YouTube worden ook geteisterd door spam die meestal bestaat uit commentaren en links naar pornografische of datingsites of ongerelateerde video's. Soms worden deze commentaren automatisch gegenereerd door Bots. Soms worden deze commentaren automatisch gegenereerd door Bots.
  • Spam in de berichtgeving van online games: het gaat om het overspoelen van berichten, verzoeken om lid te worden van een bepaalde groep, schendingen van de voorwaarden van het auteursrecht, enz.
  • Spi of spam via internettelefonie: Hierbij wordt voice over internettelefonie (VoIP) gebruikt om spam te versturen. Meestal wordt er een vooraf opgenomen bericht afgespeeld wanneer de ontvanger per ongeluk een spamoproep ontvangt. Dit platform is een kwetsbaar doelwit voor spammers omdat VoIP goedkoop is en gemakkelijk kan worden geanonimiseerd.

Soorten spam en spamtechnieken

Soorten spam

  • Kwaadaardige koppelingen: Links that harm, mislead, or otherwise harm a user’s computer.
  • Valse profielen: Spammers kunnen nepprofielen aanmaken die er anders legitiem uitzien om detectie te vermijden en niet-spammers te verleiden om bevriend met hen te raken.
  • MassamailingsDit zijn een reeks commentaren die meerdere keren worden gepubliceerd met exact dezelfde tekst, waardoor de tags die bij de commentaren horen snel een trend zetten op sociale netwerken.
  • Zwendelbeoordelingen: Deze reviews beweren dat een product origineel en goed is, ook al heeft de recensent het misschien niet gebruikt.

Spamtechnieken

  • Clickjacking: Ook bekend als UI-verbeteringspammers verleiden gebruikers om op onzichtbare doelen (bijv. knoppen) te klikken die bij een andere pagina horen. Deze vorm van spam is vooral te zien op blogs en forums.
  • Schadelijke browserextensies via drive-by downloads: Deze vorm van aanvallen vindt plaats door het downloaden van malware van het internet zonder dat de gebruiker het merkt. Dit type spam wordt meestal geleverd als schadelijke links en kan worden gevonden op blogs, websitebladwijzers, beoordelingen, enz.
  • URL-verkorters: Bij deze spamaanval versluiert de verkorte URL de werkelijke URL en leidt deze om naar de geconfigureerde bestemmingen zonder toestemming van de gebruiker. Dit type spam komt vaker voor op sociale netwerken, microblogs, recensies, enz.
  • Scriptinjectie voor social engineering: Bij deze aanval worden eindgebruikers misleid tot het uitvoeren van kwaadaardige JavaScript-code van de keuze van de spammer in de context van de site van het slachtoffer, waardoor het vertrouwen van gebruikers wordt aangetast. Ook deze aanval wordt vaak geassocieerd met onduidelijke links naar kwaadaardige programma's of websites. Het kan verschijnen als formulieren op sommige beoordelingswebsites, zoals e-mails.

Spamdetectietechnieken

Er zijn drie hoofdstrategieën om met spam om te gaan:

  • Op detectie gebaseerde technieken: Deze proberen spam te identificeren en uit het systeem te verwijderen.
  • Op degradatie gebaseerde strategieën: Deze proberen de spamrangschikking in een lijst met berichten te verlagen.
  • Op preventie gebaseerde strategieën: Deze zijn gericht op het belemmeren van het vermogen van spammers om bij te dragen aan het systeem door interfaces te wijzigen of gebruikersacties te beperken.

Nieuwste ontwikkelingen in antispamtechnieken

Spam e-mail

Collaborative filtering wordt gebruikt via een sociaal netwerk met de naam SocialFilter. Dit is een collaborative spam filtering systeem dat gebruik maakt van sociaal vertrouwen geïntegreerd in online sociale netwerken (OSN) om de betrouwbaarheid van spamrapporteurs. Het is een grafiekgebaseerde benadering die is gebaseerd op de OSN-grafiek. SocialFilter heeft als doel om de functies van meerdere spamdetectors toe te voegen en zo het tegengaan van spam te democratiseren. Elk SocialFilter-knooppunt, dat wordt beheerd door een menselijke beheerder, stuurt spammerrapporten naar een centrale opslagplaats.

Blog Spam

Blogs zijn een platform waar mensen hun emoties uiten, informatie delen en met elkaar communiceren. Met hun groeiende populariteit worden blogs nu gebruikt om blog-zoekmachineverkeer te genereren of voor promotionele doeleinden. Dit soort blogs worden Splogs genoemd. De meeste bestaande Splog-detectietechnieken zijn echter gebaseerd op inhoud, wat minder effectief is gezien de dynamische aard van blogs.

Momenteel worden er drie antispamtechnieken gebruikt om Splogs tegen te gaan:

  1. Op detectie gebaseerde technieken die een deterministische benadering gebruiken, werken met een set Technorati-querygegevens met een detectienauwkeurigheid van meer dan 60%.
  2. Op classificatie gebaseerde technieken die werken via de opmerkingen van sociale netwerken met een detectienauwkeurigheid van meer dan 60%.
  3. Op detectie gebaseerde technieken die gebruik maken van gegroepeerde sociale grafieken met behulp van publicaties op commerciële blogsites. Deze techniek wordt beschouwd als de meest efficiënte in het detecteren van spammers.

Microblog Spam

Microblogspam verwijst naar spamming op microblogplatforms, zoals Twitter, waar er een beperking is op de grootte van de tweet. Om microblogspam te detecteren zijn er verschillende technieken beschikbaar, waaronder:

  1. Deterministische benaderingen die cases bestuderen om spam te identificeren.
  2. Op classificatie gebaseerde benaderingen die zich richten op het Social Honeypot Framework.
  3. Degradatietechnieken die zich richten op Collusion Rank en PageRank.

Er zijn ook antispamtechnieken die casestudy's en classificatie combineren, zoals SPA gebaseerd op sociale grafiekenevenals technieken gebaseerd op het clusteren van spamcampagnes en het labelen ervan met behulp van RF Classifier, Lasso formulering geïntegreerd met een grafiek regularisatie term, Random Forest Classificatie met behulp van aangepaste kenmerken en ELM gebaseerde classifier met gedefinieerde kenmerken.

Bladwijzers voor spam

Social bookmarking is geëvolueerd van traditioneel bookmarking naar een platform waar gebruikers een website of webpagina kunnen toevoegen, bewerken of wijzigen voor toekomstige toegang. Op deze sites kunnen gebruikers verschillende webpagina's bookmarken en hun mening over artikelen, afbeeldingen en video's delen. Veel website-eigenaren gebruiken social bookmarking sites echter om interessante artikelen te bekijken en links op te nemen. Dit stelt websites bloot aan spammers via backlinks, omdat spammers aantrekkelijke spambladwijzers maken die door nietsvermoedende gebruikers worden gekozen.

Om bookmarking-spam tegen te gaan, zijn er verschillende antispamtechnieken beschikbaar, waaronder:

  1. Clustering- en classificatietechnieken op basis van Self-Organizing Maps (SOM) en associatieontdekking.
  2. Probabilistische kenmerkextractie en aggregatie.
  3. GraphLab Create en probabilistische zachte logica voor kenmerkextractie
  4. Gradient-Boosted Decision Tree classifier voor classificatie.

Spam op sociale netwerken

De huidige antispamtechnieken hebben vastgesteld dat de veroorzakers van spam op sociale netwerken robots zijn. Deze robots staan bekend als Displayer, Bragger, Poster en Whisperer. De antispamtechnieken voor sociale netwerken omvatten:

  • FF Verhouding: De verhouding tussen vriendschapsverzoeken en het bestaande aantal vrienden.
  • URL-ratio: De verhouding tussen URL's in een bericht en het aantal woorden.
  • Keuze van vrienden: De overeenkomst tussen de vriendenlijst van de spammer en die van het slachtoffer.
  • Verzonden berichten: Het aantal berichten dat een gebruiker verzendt in een bepaald tijdsbestek.
  • Aantal vrienden: Het aantal vrienden dat een gebruiker heeft.

Met andere woorden, dit zijn classificatie-gebaseerde technieken gebaseerd op spam-bot en spam-profiel en run-time classificatie. Clusteringstechnieken richten zich op Markov-clustering op sociale grafieken en de SOM-leeralgoritmeterwijl de detectie- en verwijderingstechnieken gebaseerd zijn op incrementele clustering gevolgd door classificatie. Classificatie- en controletechnieken richten zich op de sociale netwerkgebaseerde Social Spam Guard, en technieken voor ongesuperviseerde detectie richten zich op de Op HITS gebaseerd raamwerk.

Review Spam

Review Spam is een vorm van spam die verschijnt als recensies op verschillende e-commerce websites. Positieve beoordelingen kunnen een bedrijf een boost geven, maar negatieve beoordelingen kunnen het bedrijf schaden. Sommige spammers doen dit opzettelijk recensies plaatsen om de reputatie van een product of bedrijf te schadenen robots kunnen deze beoordelingen ook genereren. In 2013 werd een model ontworpen om synthetische recensies te genereren. Er werd een nieuwe verdedigingsmethode voorgesteld om het verschil in semantische stromen tussen valse en waarheidsgetrouwe recensies te detecteren, die moeilijk te detecteren zijn met bestaande methoden.

Momenteel zijn er verschillende antispamtechnieken voor het detecteren van reviewspam, waaronder:

  • Op classificatie gebaseerde technieken richtten zich op lineaire kernel SVM en op n-gram gebaseerde methoden.
  • Regelgebaseerde technieken.
  • Tijdsgevoelige kenmerk-gebaseerde technieken.
  • Gecombineerde technieken gebaseerd op kaders voor classificatie en clustering.
  • Op classificatie gebaseerde technieken gericht op het genereren en analyseren van synthetische beoordelingen.
  • Op Loopy Belief Propagation (LBP) gebaseerde netwerktechnieken.

Locatiezoekspam

Volgens onderzoek op het gebied van cyberbeveiliging kunnen spammers een geldig zoeksysteem infiltreren en verstoren door ongerelateerde tags aan documenten te koppelen of zelfs willekeurig documenten te vullen met termen die verband houden met een bepaalde locatie. Een methodologie voor het detecteren van spam op een locatiegebaseerde sociale bookmarking website, Foursquare, werd ontwikkeld om dit probleem aan te pakken. Met Foursquare kunnen gebruikers tips achterlaten over verschillende plaatsen en attracties, die andere gebruikers kunnen bekijken. Spammers plaatsen echter irrelevante inhoud, zoals zakelijke tips, waardoor gebruikers die meer willen weten over een bepaalde plaats worden misleid.

In dit document worden suggestiespammers geanalyseerd met als doel geautomatiseerde hulpmiddelen te ontwikkelen voor het detecteren van gebruikers die spamsuggesties plaatsen. De antispamtechnieken van Location Search zijn gebaseerd op classificatie en clustering op basis van Random Forest en Decision Tree, EM-clustering voor categorisatie en Random Forest classificatie.

Commentaar spam

Commentaarspam komt veel voor op sociale mediaplatforms, vooral op YouTube en nieuwssites. Er is een dataminingaanpak voorgesteld om spamcommentaren op YouTube-forums te filteren om deze cyberaanval te bestrijden. In tegenstelling tot inhoudsanalyse voor spamdetectie, maakt deze aanpak gebruik van commentaargedrag om spammers te identificeren. De methodologie maakt gebruik van De functie hasSpamHint van YouTube die gepaard gaat met opmerkingen van gebruikers. Dit zijn de stappen:

  1. Commentaar ophalen dat is gemarkeerd als hasSpamHint voor een bepaalde video.
  2. Extraheer de gebruikers-ID's achter de verdachte spamcommentaren om informatie te verzamelen over de commentaaractiviteit van de gebruiker.
  3. Leid attributen zoals de commentaartekst, tijdstempel, VideoID van de becommentarieerde video en de waarde van de binaire variabele hasSpamHint af uit het gebruikslogboek in discussieforums.
  4. Bereken de waarden van variabelen die de spamintentie van de gebruiker aangeven.
  5. Ken een score toe aan de gebruiker om hem te identificeren als spammer of niet.
  6. Pas een specifieke regel toe die is afgeleid van handmatige gegevensinspectie om elke gebruiker die voldoet aan de voorwaarden van de regel (met ten minste vijf opmerkingen) te markeren als spammer.

Deze antispamtechniek heet Regelgebaseerd en NLP-geïnduceerde onderwerpovereenkomst in berichten en opmerkingen gevolgd door classificatie.

Cross-media spam

Cross-media spam is een unieke antispammethode die spam op verschillende platforms detecteert. Het gaat om een snelle identificatie van spam in alle sociale netwerken en een verhoging van de nauwkeurigheid van spamdetectie met behulp van een grote dataset. Hoewel een enkele effectieve strategie niet kan worden toegepast op alle vormen en platforms van spam, is deze techniek een innovatief platformoverschrijdend raamwerk voor het detecteren van sociale spam.

Deze techniek bestaat uit drie hoofdonderdelen:

  1. Mapping en assembly gebruiken de conversie van een specifiek sociaal netwerkobject naar een door het framework gedefinieerd standaardmodel voor het object.
  2. Pre-filtering is gebaseerd op zwarte lijsten, hashing en similariteitsvergelijking om binnenkomende objecten te vergelijken met bekende spamobjecten.
  3. Classificatie is gebaseerd op technieken voor machinaal leren onder toezicht om binnenkomende en bijbehorende objecten te classificeren.

Conclusie

Spam is een wijdverspreid probleem op het internet en antispamtechnieken zijn ontwikkeld en geïmplementeerd op verschillende platforms met wisselend succes. Deze technieken kunnen grofweg worden onderverdeeld in deterministische, probabilistische of grafiekgebaseerde algoritmen, maar elke categorie kent aanzienlijke variaties. Probabilistische benaderingen worden het meest gebruikt in moderne technieken, aangezien de kenmerken van sociale netwerken aanzienlijk verschillen van die van standaarddocumenten of webpagina's. De strijd tegen spam is echter een nooit eindigend spel omdat spammers nieuwe methoden ontwikkelen om detectie te omzeilen.

Daarom is constante waakzaamheid en het ontwikkelen van nieuwe en betere technieken om spam te bestrijden essentieel om spam effectief te bestrijden.

auteursavatar

beveiliging

admin is senior staff writer voor Government Technology. Ze schreef eerder voor PYMNTS en The Bay State Banner en heeft een B.A. in creatief schrijven van Carnegie Mellon. Ze woont buiten Boston.

nl_NLDutch