Hem " Den senaste utvecklingen inom teknik för att upptäcka och bekämpa social skräppost

Den senaste utvecklingen inom teknik för att upptäcka och bekämpa social skräppost

12 mars 2023 • säkerhet

Spam refers to unwanted or unsolicited messages sent or received electronically via email, instant messaging, blogs, newsgroups, social media, web search, and mobile phones, with advertising fines, Phishing, Malware, etc. As is clear from the definition, Spam is intended for malice and generally represents a viable but fraudulent source of income for some individuals or organizations. The cyber attacker involved in sending such spam messages is generally referred to as a “spammer.” Although initially targeted and limited to email, spam has invaded all electronic platforms in all media.

Vilka typer av skräppost finns idag?

  • E-post skräppost: även känd som skräpmail, skickar oönskade meddelanden, ofta innehållande kommersiellt innehåll, i stora mängder till en urskillningslös grupp mottagare.
  • Skräppost i snabbmeddelanden använder snabbmeddelandetjänster (IM): Även om det är subtilare än sin e-postmotsvarighet, tenderar det att irritera användare av snabbmeddelandetjänster som Skype©, Yahoo!® och Messenger med oönskade meddelanden från annonsörer, etc.
  • Skräppost på nyhetsgrupper och forum: de flera och repetitiva inläggen i Usenet-nyhetsgrupper och irrelevanta internetforum.
  • Skräppost på mobiltelefoner: Denna form av skräppost använder kortmeddelandetjänster (SMS) som sin modus operandi. Ibland debiteras kunder för premiumtjänster genom att luras in i någon falsk prenumeration och bedrägeri.
  • Spamdexing: avser sökmotorskräppost eller praxis att manipulera sökmotorns rankning och relevansalgoritm för att främja en viss webbplats eller webbsida.
  • Splogs och Wikis: Skräppost på bloggar, även känd som Splog, avser kommentarer som inte är relaterade till diskussionens ämne. Dessa kommentarer är vanligtvis inbäddade med URL-länkar till några kommersiella sajter. Vissa Splogs är skrivna som detaljerade annonser för de webbplatser de främjar; andra har inget originalinnehåll och innehåller nonsens eller innehåll stulen från legitima webbplatser. Liknande typer av attacker ses också på Wikis och andra gästböcker som accepterar kommentarer från allmänna användare.
  • Skräppost på videosajter: Sociala nätverkssajter som YouTube är också fulla av skräppost som vanligtvis involverar kommentarer och länkar till någon pornografisk eller dejtingsajt eller några orelaterade videor. Ibland genereras dessa kommentarer automatiskt genom Bots.
  • Skräppost i meddelanden i onlinespel: de är flöden av meddelanden, förfrågningar att gå med i en viss grupp, överträdelser av upphovsrättsvillkor och -villkor, etc.
  • Spi eller Skräppost över internettelefoni: Detta använder röst över internettelefoni (VoIP) för att skicka skräppost. Vanligtvis spelas ett förinspelat meddelande upp när mottagaren av misstag tar emot ett skräppostsamtal. Denna plattform är ett sårbart mål för skräppostare eftersom VoIP är billigt och lätt att anonymisera.

Typer av skräppost och skräpposttekniker

Typer av skräppost

  • Skadliga länkar: Links that harm, mislead, or otherwise harm a user’s computer.
  • Falska profiler: Skräppostare kan skapa falska profiler som annars skulle verka legitima för att undvika upptäckt och locka icke-skräppostare att bli vänner med dem.
  • Massutskick: de är kända som skräppostbomber; de är en uppsättning kommentarer som publiceras flera gånger med exakt samma text, vilket gör att taggarna som är associerade med kommentarerna snabbt trendar på sociala nätverk.
  • Bedrägerirecensioner: Dessa recensioner hävdar att en produkt är original och bra, även om recensenten kanske inte har använt den.

Skräpposttekniker

  • Clickjacking: Även känd som UI-redressing, lurar skräppostare användare att klicka på osynliga mål (t.ex. knappar) som tillhör en annan sida. Denna form av skräppost kan ses främst på bloggar och forum.
  • Skadliga webbläsartillägg via drive-by nedladdningar: This form of attack occurs by downloading malware from the Internet without the user’s notice. This type of spam usually comes as malicious links and can be found on blogs, website bookmarks, reviews, etc.
  • URL-förkortare: In this spam attack, the shortened URL obfuscates the actual URL and redirects to its configured destinations without the user’s consent. This type of spam is more frequent in social networks, microblogs, reviews, etc.
  • Social ingenjörsskriptinjektion: In this attack, end-users are tricked into executing malicious JavaScript code of the spammer’s choice in the context of the victim’s site, thereby attacking users’ trust. Again, this attack is often associated with obscure links to malicious programs or websites. It may appear as forms on some review websites, such as emails.

Skräppostdetekteringstekniker

Det finns tre huvudstrategier för att hantera skräppost:

  • Detektionsbaserade tekniker: Dessa försöker identifiera och ta bort skräppost från systemet.
  • Nedgraderingsbaserade strategier: Dessa försöker sänka skräppostrangordningen i en lista över meddelanden.
  • Förebyggande strategier: Dessa syftar till att hindra skräppostare från att bidra till systemet genom att ändra gränssnitt eller begränsa användaråtgärder.

Senaste utvecklingen inom antispamtekniker

E-post Skräppost

Samarbetsfiltrering används genom ett socialt nätverk som kallas SocialFilter, vilket är ett samarbetsbaserat skräppostfiltreringssystem som använder socialt förtroende integrerat i online sociala nätverk (OSN) för att utvärdera tillförlitligheten hos skräppostrapportörer. Det är en grafbaserad metod som baseras på OSN-grafen. SocialFilter syftar till att lägga till funktionerna hos flera skräppostdetektorer och därigenom demokratisera skräppostbekämpning. Varje SocialFilter-nod, som hanteras av en mänsklig administratör, skickar skräppostrapporter till ett centraliserat arkiv.

Blogg Skräppost

Bloggar är en plattform där människor uttrycker sina känslor, delar information och kommunicerar med varandra. Med deras växande popularitet används bloggar nu för att driva bloggsökmotortrafik eller för marknadsföringsändamål. Dessa typer av bloggar kallas Splogs. Men de flesta befintliga Splog-detekteringstekniker är innehållsbaserade, vilket är mindre effektivt med tanke på bloggars dynamiska natur.

För närvarande används tre antispamtekniker för att bekämpa Splogs:

  1. Detektionsbaserade tekniker som använder en deterministisk metod arbetar med en uppsättning Technorati Queries-data med detektionsnoggrannhet större än 60%.
  2. Klassificeringsbaserade tekniker som verkar genom kommentarer från sociala nätverk med detektionsnoggrannhet större än 60%.
  3. Detektionsbaserade tekniker som använder grupperade sociala grafer med hjälp av publikationer på kommersiella bloggsajter. Denna teknik anses vara den mest effektiva för att upptäcka skräppostare.

Mikroblogg Skräppost

Mikroblogg skräppost avser skräppost på mikrobloggningsplattformar, såsom Twitter, där det finns en begränsning på storleken av tweeten. För att upptäcka mikroblogg skräppost finns det flera tekniker tillgängliga, inklusive:

  1. Deterministiska metoder som studerar fall för att identifiera skräppost.
  2. Klassificeringsbaserade metoder som fokuserar på Social Honeypot Framework.
  3. Nedgraderingstekniker som fokuserar på Collusion Rank och PageRank.

Det finns också antispamtekniker som kombinerar fallstudier och klassificering, såsom social-graf baserad Mr. SPA, samt tekniker baserade på klustring av skräppostkampanjer och märkning av dem med RF Classifier, Lasso-formulering integrerad med en grafregulariseringsterm, Random Forest Classification med justerade funktioner och ELM-baserad klassificerare med definierade funktioner.

Bokmärkeskräppost

Sociala bokmärken har utvecklats från traditionella bokmärken till en plattform där användare kan lägga till, redigera eller ändra en webbplats eller webbsida för framtida åtkomst. Dessa sajter tillåter användare att bokmärka olika webbsidor och dela sina åsikter om artiklar, bilder och videor. Men många webbplatsägare använder sociala bokmärkessajter för att bläddra i intressanta artiklar och inkludera länkar. Detta utsätter webbplatser för skräppostare genom bakåtlänkar, eftersom skräppostare skapar attraktiva skräppostbokmärken som väljs av intet ont anande användare.

För att bekämpa bokmärkeskräppost finns det olika antispamtekniker tillgängliga, inklusive:

  1. Klustrings- och klassificeringstekniker baserade på självorganiserande kartor (SOM) klustring och associationsupptäckt.
  2. Sannolikhetsbaserad funktionsutvinning och aggregering.
  3. GraphLab Create och Probabilistic Soft Logic för funktionsutvinning
  4. Gradient-Boosted Decision Tree klassificerare för klassificering.

Sociala nätverksskräppost

Nuvarande antispamtekniker har identifierat att generatorerna av sociala nätverksskräppost är robotar. Dessa robotar är kända som Displayer, Bragger, Poster och Whisperer. Antispamteknikerna för sociala nätverk inkluderar:

  • FF Ratio: Förhållandet mellan vänförfrågningar och det befintliga antalet vänner.
  • URL-förhållande: Förhållandet mellan URL:er i ett meddelande och antalet ord.
  • Friend choice: The similarity between the spammer and the victim’s friend lists.
  • Skickade meddelanden: Antalet meddelanden en användare skickar under en given tidsram.
  • Antal vänner: Antalet vänner en användare har.

Med andra ord, dessa är klassificeringsbaserade tekniker baserade på skräppost-bot och skräppostprofil och körningstidklassificering. Klustringstekniker fokuserar på Markov-klustring på sociala grafer och SOM-lärandealgoritmen, medan detektions- och borttagningstekniker är baserade på inkrementell klustring följt av klassificering. Klassificerings- och övervakningstekniker fokuserar på det sociala nätverksbaserade Social Spam Guard, och oövervakade detektionstekniker fokuserar på HITS-baserad ramverk.

Recensionskräppost

Review Spam is a type of spam that appears as reviews on various e-commerce websites. Positive reviews can boost a company’s business, but negative reviews can harm it. Some spammers intentionally publicera recensioner för att skada en produkts eller företags rykte, och robotar kan också generera dessa recensioner. År 2013 designades en modell för att generera syntetiska recensioner. En ny försvarsmetod föreslogs för att upptäcka skillnaden i semantiska flöden mellan falska och sanna recensioner, som är svåra att upptäcka med befintliga metoder.

För närvarande finns det flera antispamtekniker för att upptäcka recensionskräppost, inklusive:

  • Klassificeringsbaserade tekniker fokuserade på linjär kärna SVM och n-gram-baserade metoder.
  • Regelbaserade tekniker.
  • Tidskänsliga funktionsbaserade tekniker.
  • Kombinerade tekniker baserade på ramverk för klassificering och klustring.
  • Klassificeringsbaserade tekniker fokuserade på att generera och analysera syntetiska recensioner.
  • Loopy Belief Propagation (LBP) nätverksbaserade tekniker.

Platsbaserad sökskräppost

Enligt cybersäkerhetsforskning kan skräppostare infiltrera och störa ett giltigt söksystem genom att associera orelaterade taggar med dokument eller till och med slumpmässigt införa dokument med termer relaterade till en viss plats. En metodik för att upptäcka skräppost på en platsbaserad social bokmärkessajt, Foursquare, utvecklades för att hantera detta problem. Foursquare tillåter användare att lämna tips om olika platser och attraktioner, som andra användare kan komma åt. Men skräppostare publicerar irrelevant innehåll, såsom affärstips, vilket vilseleder användare som är intresserade av att lära sig om en viss plats.

Detta dokument analyserar förslagsskräppostare, med målet att utveckla automatiserade verktyg för att upptäcka användare som publicerar skräpförslag. De platsbaserade sökskräppostteknikerna är baserade på klassificering och klustring fokuserad på Random Forest och beslutsträdesbaserad klassificering, EM-klustring för kategorisering och Random Forest-klassificering.

Kommentarskräppost

Kommentarskräppost är vanligt förekommande på sociala medieplattformar, särskilt på YouTube och nyhetssajter. En datautvinningsmetod har föreslagits för att filtrera skräppostkommentarer på YouTube-forum för att bekämpa denna cyberattack. Till skillnad från innehållsanalys för skräppostdetektering utnyttjar denna metod kommentarens beteende för att identifiera skräppostare. Metodiken utnyttjar YouTube’s hasSpamHint feature som åtföljer användarkommentarer. Här är stegen som ingår:

  1. Hämta kommentarer markerade som hasSpamHint för en given video.
  2. Extrahera användar-ID:n bakom de misstänkta skräppostkommentarerna för att samla information om användarens kommentarsaktivitet.
  3. Härled attribut som kommentartext, tidsstämpel, VideoID för den kommenterade videon och värdet av hasSpamHint binär variabel från användningsloggen i diskussionsforum.
  4. Beräkna värdena för variabler som indikerar användarens skräppostavsikt.
  5. Tilldela en poäng till användaren för att identifiera dem som en skräppostare eller inte.
  6. Apply a specific rule derived from manual data inspection to mark any user who meets the rule’s conditions (with at least five comments) as a spammer.

Denna antispamteknik kallas Regelbaserad och NLP-inducerad ämneslikhet i inlägg och kommentarer följt av klassificering.

Cross-media skräppost

Cross-media skräppost är en unik antispammetodik som upptäcker skräppost över olika plattformar. Det innebär snabb identifiering av skräppost i alla sociala nätverk och en ökning av skräppostdetekteringsnoggrannheten med deltagande av en stor datamängd. Även om en enda effektiv strategi inte kan tillämpas på alla former och plattformar av skräppost, är denna teknik ett innovativt plattformsövergripande ramverk för att upptäcka social skräppost.

Denna teknik är indelad i tre huvudkomponenter:

  1. Kartläggning och montering använder konvertering av ett specifikt socialt nätverksobjekt till en ramverksdefinierad standardmodell för objektet.
  2. Förfiltrering är baserad på svartlistor, hashning och likhetsjämförelse för att jämföra inkommande objekt med kända skräppostobjekt.
  3. Klassificering är baserad på övervakade maskininlärningstekniker för att klassificera inkommande och associerade objekt.

Sammanfattningsvis

Skräppost är ett utbrett problem på internet, och antispamtekniker har utvecklats och implementerats över olika plattformar med varierande grad av framgång. Dessa tekniker faller brett in i deterministiska, sannolikhetsbaserade eller grafbaserade algoritmer, men varje kategori har betydande variation. Sannolikhetsbaserade metoder är mest använda i moderna tekniker, eftersom egenskaperna hos sociala nätverk skiljer sig avsevärt från standarddokument eller webbsidor. Men kampen mot skräppost är ett oändligt spel eftersom skräppostare utvecklar nya metoder för att undvika upptäckt.

Därför är ständig vaksamhet och utveckling av nya och bättre skräppostbekämpningstekniker avgörande för att effektivt bekämpa skräppost.

författarens avatar

säkerhet

admin är en senior personalförfattare för Government Technology. Hon skrev tidigare för PYMNTS och The Bay State Banner och har en BA i kreativt skrivande från Carnegie Mellon. Hon är baserad utanför Boston.

sv_SESwedish