Hjem " Den seneste udvikling i teknikker til at opdage og bekæmpe social spam

Den seneste udvikling i teknikker til at opdage og bekæmpe social spam

12. marts 2023 • sikkerhed

Spam refers to unwanted or unsolicited messages sent or received electronically via email, instant messaging, blogs, newsgroups, social media, web search, and mobile phones, with advertising fines, Phishing, Malware, etc. As is clear from the definition, Spam is intended for malice and generally represents a viable but fraudulent source of income for some individuals or organizations. The cyber attacker involved in sending such spam messages is generally referred to as a “spammer.” Although initially targeted and limited to email, spam has invaded all electronic platforms in all media.

Hvilke slags spam findes i dag?

  • E-mail spam: også kendt som junk mail, sender uønskede beskeder, ofte med kommercielt indhold, i store mængder til et vilkårligt sæt modtagere.
  • Spam i instant messaging bruger instant messengers (IM): Selvom det er mere subtilt end sin e-mail-modpart, har det en tendens til at irritere brugere af instant messengers som Skype©, Yahoo!®, og Messenger med uopfordrede beskeder fra annoncører osv.
  • Spam på nyhedsgrupper og fora: de multiple og gentagne opslag i Usenet-nyhedsgrupper og irrelevante internetfora.
  • Mobiltelefon spam: Denne form for spam bruger kortbeskedstjenester (SMS) som sin modus operandi. Nogle gange bliver kunder opkrævet for premiumtjenester ved at blive narret til et falsk abonnement og svindel.
  • Spamdexing: refererer til søgemaskinespam eller praksis med at manipulere søgemaskinens rangering og relevansalgoritme for at promovere en bestemt hjemmeside eller webside.
  • Splogs og Wikis: Spam på blogs, også kendt som Splog, refererer til kommentarer, der ikke er relateret til diskussionsemnet. Disse kommentarer er normalt indlejret med URL-links til nogle kommercielle sider. Nogle Splogs er skrevet som detaljerede annoncer for de hjemmesider, de promoverer; andre har intet originalt indhold og indeholder vrøvl eller indhold stjålet fra legitime hjemmesider. Lignende typer angreb ses også på Wikis og andre gæstebøger, der accepterer kommentarer fra almindelige brugere.
  • Spam på videosider: Sociale netværkssider som YouTube er også plaget af spam, der normalt involverer kommentarer og links til nogle pornografiske eller dating-sider eller nogle ikke-relaterede videoer. Nogle gange genereres disse kommentarer automatisk gennem bots.
  • Spam i beskeder i online spil: de er oversvømmelser af beskeder, anmodninger om at deltage i en bestemt gruppe, overtrædelser af ophavsretsbetingelser osv.
  • Spi eller Spam over Internet-telefoni: Dette bruger voice over Internet-telefoni (VoIP) til at sende spam. Typisk afspilles en forudindspillet besked, når modtageren fejlagtigt modtager et spamopkald. Denne platform er et sårbart mål for spammere, da VoIP er billigt og let kan anonymiseres.

Typer af spam og spamming teknikker

Typer af spam

  • Skadelige links: Links that harm, mislead, or otherwise harm a user’s computer.
  • Falske profiler: Spammere kan oprette falske profiler, der ellers ville fremstå legitime for at undgå detektion og lokke ikke-spammere til at blive venner med dem.
  • Masseudsendelser: de er kendt som spam-bomber; de er et sæt kommentarer offentliggjort flere gange med den samme tekst, hvilket gør det muligt for de tags, der er forbundet med kommentarerne, hurtigt at trende på sociale netværk.
  • Svindelanmeldelser: Disse anmeldelser hævder, at et produkt er originalt og godt, selvom anmelderen måske ikke har brugt det.

Spamming teknikker

  • Clickjacking: også kendt som UI-redigering, spammere narrer brugere til at klikke på usynlige mål (f.eks. knapper), der tilhører en anden side. Denne form for spam ses hovedsageligt på blogs og fora.
  • Skadelige browserudvidelser via drive-by downloads: This form of attack occurs by downloading malware from the Internet without the user’s notice. This type of spam usually comes as malicious links and can be found on blogs, website bookmarks, reviews, etc.
  • URL-forkortere: In this spam attack, the shortened URL obfuscates the actual URL and redirects to its configured destinations without the user’s consent. This type of spam is more frequent in social networks, microblogs, reviews, etc.
  • Social Engineering Script Injection: In this attack, end-users are tricked into executing malicious JavaScript code of the spammer’s choice in the context of the victim’s site, thereby attacking users’ trust. Again, this attack is often associated with obscure links to malicious programs or websites. It may appear as forms on some review websites, such as emails.

Spamdetektionsteknikker

Der er tre hovedstrategier til at håndtere spam:

  • Detektionsbaserede teknikker: Disse forsøger at identificere og fjerne spam fra systemet.
  • Nedgraderingsbaserede strategier: Disse forsøger at sænke spamrangeringen i en liste over beskeder.
  • Forebyggelsesbaserede strategier: Disse sigter mod at hindre spammere i at bidrage til systemet ved at ændre grænseflader eller begrænse brugerhandlinger.

Seneste udviklinger i antispam-teknikker

E-mail spam

Samarbejdsfiltrering bruges gennem et socialt netværk kaldet SocialFilter, som er et samarbejdende spamfiltreringssystem, der bruger social tillid integreret i online sociale netværk (OSN) til at evaluere pålideligheden af spamrapportører. Det er en grafbaseret tilgang, der er baseret på OSN-grafen. SocialFilter sigter mod at tilføje funktionerne fra flere spamdetektorer og dermed demokratisere spamafhjælpning. Hver SocialFilter-node, som administreres af en menneskelig administrator, sender spammerrapporter til et centralt lager.

Blog spam

Blogs er en platform, hvor folk udtrykker deres følelser, deler information og kommunikerer med hinanden. Med deres voksende popularitet bruges blogs nu til at drive blog-søgemaskinetrafik eller til reklameformål. Disse typer blogs kaldes Splogs. Dog er de fleste eksisterende Splog-detektionsteknikker indholdsbaserede, hvilket er mindre effektivt givet blogs' dynamiske natur.

I øjeblikket bruges tre antispam-teknikker til at bekæmpe Splogs:

  1. Detektionsbaserede teknikker, der bruger en deterministisk tilgang, arbejder med et sæt Technorati-forespørgselsdata med en detektionsnøjagtighed på over 60%.
  2. Klassifikationsbaserede teknikker, der opererer gennem kommentarer fra sociale netværk med en detektionsnøjagtighed på over 60%.
  3. Detektionsbaserede teknikker, der bruger grupperede sociale grafer ved hjælp af publikationer på kommercielle blogsider. Denne teknik betragtes som den mest effektive til at opdage spammere.

Mikroblog spam

Mikroblog spam refererer til spamming på mikroblogging-platforme, såsom Twitter, hvor der er en begrænsning på størrelsen af tweetet. For at opdage mikroblog spam er der flere teknikker tilgængelige, herunder:

  1. Deterministiske tilgange, der studerer sager for at identificere spam.
  2. Klassifikationsbaserede tilgange, der fokuserer på Social Honeypot Framework.
  3. Nedgraderingsmetoder, der fokuserer på Collusion Rank og PageRank.

Der er også antispam-teknikker, der kombinerer casestudier og klassifikation, såsom social-graf baseret Mr. SPA, samt teknikker baseret på clustering af spamkampagner og mærkning af dem ved hjælp af RF Classifier, Lasso-formulering integreret med et grafreguleringsterm, Random Forest Classification ved hjælp af justerede funktioner og ELM-baseret klassifikator med definerede funktioner.

Bogmærke spam

Social bogmærkning har udviklet sig fra traditionel bogmærkning til en platform, hvor brugere kan tilføje, redigere eller ændre en hjemmeside eller webside til fremtidig adgang. Disse sider tillader brugere at bogmærke forskellige websider og dele deres meninger om artikler, billeder og videoer. Dog bruger mange hjemmesideejere sociale bogmærkningssider til at gennemse interessante artikler og inkludere links. Dette udsætter hjemmesider for spammere gennem backlinks, da spammere opretter attraktive spam-bogmærker, der vælges af intetanende brugere.

For at bekæmpe bogmærke spam er der forskellige antispam-teknikker tilgængelige, herunder:

  1. Clustering og klassifikationsteknikker baseret på Self-Organizing Maps (SOM) clustering og associationsopdagelse.
  2. Sandsynlighedsfunktionsekstraktion og aggregering.
  3. GraphLab Create og Probabilistic Soft Logic til funktionsekstraktion
  4. Gradient-Boosted Decision Tree klassifikator til klassifikation.

Socialt netværk spam

Nuværende antispam-teknikker har identificeret, at generatorerne af socialt netværk spam er robotter. Disse robotter er kendt som Displayer, Bragger, Poster og Whisperer. Antispam-teknikkerne for sociale netværk inkluderer:

  • FF Ratio: Forholdet mellem venneanmodninger og det eksisterende antal venner.
  • URL-forhold: Forholdet mellem URL'er i en besked og antallet af ord.
  • Friend choice: The similarity between the spammer and the victim’s friend lists.
  • Sendte beskeder: Antallet af beskeder en bruger sender inden for en given tidsramme.
  • Antal venner: Antallet af venner en bruger har.

Med andre ord er disse klassifikationsbaserede teknikker baseret på spam-bot og spam-profil og runtime-klassifikation. Clustering-teknikker fokuserer på Markov-clustering på sociale grafer og SOM-læringsalgoritmen, mens detektions- og fjernelsesteknikker er baseret på inkrementel clustering efterfulgt af klassifikation. Klassifikations- og overvågningsteknikker fokuserer på det socialt netværksbaserede Social Spam Guard, og usuperviserede detektionsteknikker fokuserer på HITS-baseret framework.

Anmeldelse spam

Review Spam is a type of spam that appears as reviews on various e-commerce websites. Positive reviews can boost a company’s business, but negative reviews can harm it. Some spammers intentionally poste anmeldelser for at skade et produkts eller en virksomheds omdømme, og robotter kan også generere disse anmeldelser. I 2013 blev der designet en model til at generere syntetiske anmeldelser. En ny forsvarsmetode blev foreslået for at opdage forskellen i semantiske flows mellem falske og sandfærdige anmeldelser, som er svære at opdage ved hjælp af eksisterende metoder.

I øjeblikket er der flere antispam-teknikker til at opdage anmeldelse spam, herunder:

  • Klassifikationsbaserede teknikker fokuseret på lineær kernel SVM og n-gram-baserede metoder.
  • Regelbaserede teknikker.
  • Tidssensitive funktionsbaserede teknikker.
  • Kombinerede teknikker baseret på frameworks til klassifikation og clustering.
  • Klassifikationsbaserede teknikker fokuseret på generering og analyse af syntetiske anmeldelser.
  • Loopy Belief Propagation (LBP) netværksbaserede teknikker.

Lokationssøgningsspam

Ifølge cybersikkerhedsforskning kan spammere infiltrere og forstyrre et gyldigt søgesystem ved at associere ikke-relaterede tags med dokumenter eller endda tilfældigt infusere dokumenter med termer relateret til en bestemt placering. En metodologi til at opdage spam på en lokalitetsbaseret social bogmærkningsside, Foursquare, blev udviklet for at tackle dette problem. Foursquare tillader brugere at efterlade tips om forskellige steder og attraktioner, som andre brugere kan få adgang til. Dog poster spammere irrelevant indhold, såsom forretningstips, der vildleder brugere, der er interesseret i at lære om et bestemt sted.

Dette dokument analyserer forslagsspammere med det formål at udvikle automatiserede værktøjer til at opdage brugere, der poster spamforslag. Lokationssøgnings antispam-teknikker er baseret på klassifikation og clustering fokuseret på Random Forest og Decision Tree-baseret klassifikation, EM-klyngedannelse til kategorisering og Random Forest klassifikation.

Kommentar spam

Kommentar spam er udbredt på sociale medieplatforme, især på YouTube og nyhedssider. En data mining-tilgang er blevet foreslået for at filtrere spam-kommentarer på YouTube-fora for at bekæmpe dette cyberangreb. I modsætning til indholdsanalyse til spamdetektion udnytter denne tilgang kommentaradfærd til at identificere spammere. Metodologien drager fordel af YouTube’s hasSpamHint feature der ledsager brugerkommentarer. Her er de involverede trin:

  1. Hent kommentarer markeret som hasSpamHint for en given video.
  2. Uddrag bruger-ID'er bag de mistænkte spam-kommentarer for at indsamle oplysninger om brugerkommentaraktivitet.
  3. Udled attributter som kommentarens tekst, tidsstempel, VideoID for den kommenterede video og værdien af hasSpamHint binær variabel fra brugsloggen i diskussionsfora.
  4. Beregn værdierne af variabler, der indikerer brugerens spamintention.
  5. Tildel en score til brugeren for at identificere dem som en spammer eller ej.
  6. Apply a specific rule derived from manual data inspection to mark any user who meets the rule’s conditions (with at least five comments) as a spammer.

Denne antispam-teknik kaldes Regelbaseret og NLP-induceret emnelighed i indlæg og kommentarer efterfulgt af klassifikation.

Tværmedie spam

Cross-media spam er en unik antispam-metodologi, der opdager spam på tværs af forskellige platforme. Det involverer hurtig identifikation af spam i alle sociale netværk og en stigning i spamdetektionsnøjagtighed med deltagelse af et stort datasæt. Selvom en enkelt effektiv strategi ikke kan anvendes på alle former og platforme for spam, er denne teknik en innovativ tværplatformsramme til at opdage social spam.

Denne teknik er opdelt i tre hovedkomponenter:

  1. Kortlægning og samling bruger konverteringen af et specifikt socialt netværksobjekt til en ramme-defineret standardmodel for objektet.
  2. Forfiltrering er baseret på sortlister, hashing og lighedssammenligning for at sammenligne indkommende objekter med kendte spamobjekter.
  3. Klassifikation er baseret på overvågede maskinlæringsteknikker til at klassificere indkommende og tilknyttede objekter.

Som konklusion

Spam er et udbredt problem på internettet, og antispam-teknikker er blevet udviklet og implementeret på tværs af forskellige platforme med varierende grad af succes. Disse teknikker falder bredt ind i deterministiske, sandsynlighedsbaserede eller grafbaserede algoritmer, men hver kategori har betydelig variation. Sandsynlighedsbaserede tilgange er mest almindeligt anvendt i moderne teknikker, da karakteristikaene for sociale netværk adskiller sig betydeligt fra standarddokumenter eller websider. Dog er kampen mod spam et uendeligt spil, da spammere udvikler nye metoder til at undgå detektion.

Derfor er konstant årvågenhed og udvikling af nye og bedre spam-bekæmpelsesteknikker afgørende for effektivt at bekæmpe spam.

Forfatterens avatar

sikkerhed

admin er seniorskribent for Government Technology. Hun har tidligere skrevet for PYMNTS og The Bay State Banner og har en BA i kreativ skrivning fra Carnegie Mellon. Hun bor uden for Boston.

da_DKDanish