Otthon » A szociális spam észlelésének és leküzdésének legújabb fejleményei

A szociális spam észlelésének és leküzdésének legújabb fejleményei

2023. március 12. • biztonság

Spam refers to unwanted or unsolicited messages sent or received electronically via email, instant messaging, blogs, newsgroups, social media, web search, and mobile phones, with advertising fines, Phishing, Malware, etc. As is clear from the definition, Spam is intended for malice and generally represents a viable but fraudulent source of income for some individuals or organizations. The cyber attacker involved in sending such spam messages is generally referred to as a “spammer.” Although initially targeted and limited to email, spam has invaded all electronic platforms in all media.

Milyen típusú spam létezik ma?

  • E-mail spam: más néven kéretlen levél, nem kívánt üzeneteket küld, gyakran kereskedelmi tartalommal, nagy mennyiségben, válogatás nélküli címzetteknek.
  • Spam az azonnali üzenetküldésben az azonnali üzenetküldőket (IM) használja: Bár finomabb, mint az e-mail megfelelője, hajlamos bosszantani az azonnali üzenetküldők, mint a Skype©, Yahoo!® és Messenger felhasználóit kéretlen üzenetekkel hirdetőktől stb.
  • Spam a hírcsoportokban és fórumokon: a többszörös és ismétlődő bejegyzések a Usenet hírcsoportokban és irreleváns internetes fórumokon.
  • Mobiltelefon spam: Ez a spam forma rövid üzenet szolgáltatásokat (SMS) használ, mint működési módját. Néha az ügyfeleket prémium szolgáltatásokért számlázzák ki, miután becsapják őket valamilyen hamis előfizetéssel és csalással.
  • Spamdexing: a keresőmotor spamre vagy a keresőmotor rangsorolási és relevancia algoritmusának manipulálására utal, hogy egy adott weboldalt vagy weboldalt népszerűsítsen.
  • Splogok és Wikik: A blogokon lévő spam, más néven Splog, olyan megjegyzésekre utal, amelyek nem kapcsolódnak a vita témájához. Ezek a megjegyzések általában URL-linkeket tartalmaznak kereskedelmi oldalakra. Néhány Splog részletes bejelentéseket ír az általuk népszerűsített weboldalak számára; másoknak nincs eredeti tartalmuk, értelmetlen vagy legitim weboldalakról lopott tartalmat tartalmaznak. Hasonló típusú támadások láthatók a Wikiken és más vendégkönyvekben is, amelyek általános felhasználóktól fogadnak el megjegyzéseket.
  • Spam a videó oldalakon: A közösségi hálózati weboldalak, mint a YouTube, szintén tele vannak spamokkal, amelyek általában megjegyzéseket és linkeket tartalmaznak pornográf vagy társkereső oldalakra vagy nem kapcsolódó videókra. Néha ezek a megjegyzések automatikusan generálódnak botok által.
  • Spam az online játékok üzenetküldésében: ezek üzenetáradatok, meghívások egy adott csoporthoz való csatlakozásra, szerzői jogi feltételek megsértése stb.
  • Spi vagy Spam az internetes telefonálás felett: Ez az internetes telefonálás (VoIP) használatával küld spamet. Általában egy előre rögzített üzenet játszódik le, amikor a címzett tévesen fogad egy spam hívást. Ez a platform sebezhető célpont a spammerek számára, mivel a VoIP olcsó és könnyen anonimizálható.

A spam típusai és spamelési technikák

A spam típusai

  • Rosszindulatú linkek: Links that harm, mislead, or otherwise harm a user’s computer.
  • Hamis profilok: A spammerek hamis profilokat hozhatnak létre, amelyek egyébként legitimnek tűnnek, hogy elkerüljék a felismerést és becsapják a nem spammereket, hogy barátkozzanak velük.
  • Tömeges levelezés: ezek spam bombák néven ismertek; ezek egy sor megjegyzés, amelyeket többször ugyanazzal a szöveggel tesznek közzé, ami lehetővé teszi, hogy a megjegyzésekhez társított címkék gyorsan trendivé váljanak a közösségi hálózatokon.
  • Csaló értékelések: Ezek az értékelések azt állítják, hogy egy termék eredeti és jó, bár az értékelő lehet, hogy nem is használta azt.

Spamelési technikák

  • Clickjacking: más néven UI-redressing, a spammerek becsapják a felhasználókat, hogy láthatatlan célpontokra (pl. gombokra) kattintsanak, amelyek egy másik oldalhoz tartoznak. Ez a spam forma főként blogokon és fórumokon látható.
  • Rosszindulatú böngészőbővítmények drive-by letöltéseken keresztül: This form of attack occurs by downloading malware from the Internet without the user’s notice. This type of spam usually comes as malicious links and can be found on blogs, website bookmarks, reviews, etc.
  • URL rövidítők: In this spam attack, the shortened URL obfuscates the actual URL and redirects to its configured destinations without the user’s consent. This type of spam is more frequent in social networks, microblogs, reviews, etc.
  • Társadalmi mérnöki szkript injekció: In this attack, end-users are tricked into executing malicious JavaScript code of the spammer’s choice in the context of the victim’s site, thereby attacking users’ trust. Again, this attack is often associated with obscure links to malicious programs or websites. It may appear as forms on some review websites, such as emails.

Spam felismerési technikák

Három fő stratégia létezik a spam kezelésére:

  • Felismerés alapú technikák: Ezek megpróbálják azonosítani és eltávolítani a spamet a rendszerből.
  • Degradáció alapú stratégiák: Ezek megpróbálják csökkenteni a spam rangsorát egy üzenetlistában.
  • Megelőzés alapú stratégiák: Ezek célja, hogy akadályozzák a spammerek képességét a rendszerhez való hozzájárulásra az interfészek megváltoztatásával vagy a felhasználói tevékenységek korlátozásával.

Legújabb fejlemények a spam elleni technikákban

E-mail spam

Közösségi szűrést használnak egy SocialFilter nevű közösségi hálózaton keresztül, amely egy közösségi spam szűrőrendszer, amely a társadalmi bizalmat integrálja online közösségi hálózatokba (OSN) a spam jelentők megbízhatóságának. értékelésére. Ez egy gráf alapú megközelítés, amely az OSN gráfon alapul. A SocialFilter célja, hogy több spam detektor funkcióit hozzáadja, ezáltal demokratizálva a spam mérséklését. Minden SocialFilter csomópontot, amelyet egy emberi adminisztrátor kezel, spammer jelentéseket küld egy központi adattárba.

Blog spam

A blogok egy platform, ahol az emberek kifejezik érzelmeiket, megosztják az információkat és kommunikálnak egymással. Növekvő népszerűségükkel a blogokat most már blog keresőmotor forgalmának növelésére vagy promóciós célokra használják. Ezeket a blogokat Splogoknak hívják. Azonban a legtöbb meglévő Splog felismerési technika tartalom alapú, ami kevésbé hatékony a blogok dinamikus természete miatt.

Jelenleg három spam elleni technikát használnak a Splogok elleni küzdelemre:

  1. Felismerés alapú technikák, amelyek determinisztikus megközelítést alkalmaznak Technorati Queries adatokkal, 60%-nál nagyobb felismerési pontossággal.
  2. Osztályozás alapú technikák, amelyek a közösségi hálózatok megjegyzésein keresztül működnek, 60%-nál nagyobb felismerési pontossággal.
  3. Felismerés alapú technikák, amelyek csoportosított társadalmi gráfokat használnak kereskedelmi blogoldalakon való publikációk alapján. Ezt a technikát tekintik a leghatékonyabbnak a spammerek felismerésében.

Mikroblog spam

A mikroblog spam a mikroblog platformokon való spamelésre utal, mint például a Twitter, ahol korlátozott a tweet mérete. A mikroblog spam felismerésére több technika is elérhető, beleértve:

  1. Determinisztikus alapú megközelítések, amelyek eseteket tanulmányoznak a spam azonosítására.
  2. Osztályozás alapú megközelítések, amelyek a Social Honeypot Framework-re összpontosítanak.
  3. Degradációs technikák, amelyek a Collusion Rank és a PageRank-ra összpontosítanak.

Vannak olyan spam elleni technikák is, amelyek kombinálják az esettanulmányokat és az osztályozást, mint például a társadalmi gráf alapú Mr. SPA, valamint technikák, amelyek a spam kampányok klaszterezésére és RF Classifier, Lasso formuláció grafikus regularizációs taggal való címkézésére, Random Forest osztályozás módosított jellemzőkkel és ELM alapú osztályozó meghatározott jellemzőkkel.

Könyvjelző spam

A közösségi könyvjelzőzés a hagyományos könyvjelzőzéstől egy olyan platformmá fejlődött, ahol a felhasználók hozzáadhatnak, szerkeszthetnek vagy módosíthatnak egy weboldalt vagy weboldalt a jövőbeni hozzáférés érdekében. Ezek az oldalak lehetővé teszik a felhasználók számára, hogy különböző weboldalakat könyvjelzőzzenek és megosszák véleményüket cikkekről, képekről és videókról. Azonban sok weboldal tulajdonos használ közösségi könyvjelző oldalakat érdekes cikkek böngészésére és linkek beillesztésére. Ezáltal a weboldalak ki vannak téve a spammereknek a visszamutató linkeken keresztül, mivel a spammerek vonzó spam könyvjelzőket hoznak létre, amelyeket gyanútlan felhasználók választanak ki.

A könyvjelző spam elleni küzdelem érdekében különböző spam elleni technikák állnak rendelkezésre, beleértve:

  1. Klaszterezési és osztályozási technikák az önszerveződő térképek (SOM) klaszterezés és asszociáció felfedezés alapján.
  2. Valószínűségi jellemzők kinyerése és összesítése.
  3. GraphLab Create és valószínűségi lágy logika a jellemzők kinyerésére
  4. Gradiens növelt döntési fa osztályozó az osztályozáshoz.

Közösségi hálózati spam

A jelenlegi spam elleni technikák azonosították, hogy a közösségi hálózati spam generátorai robotok. Ezeket a robotokat Displayer, Bragger, Poster és Whisperer néven ismerik. A közösségi hálózatok spam elleni technikái közé tartozik:

  • FF arány: A barátkérések aránya a meglévő barátok számához képest.
  • URL arány: Az URL-ek aránya egy üzenetben a szavak számához képest.
  • Friend choice: The similarity between the spammer and the victim’s friend lists.
  • Küldött üzenetek: Az üzenetek száma, amelyeket egy felhasználó egy adott időkeretben küld.
  • Barátok száma: A barátok száma, amelyeket egy felhasználó rendelkezik.

Más szavakkal, ezek osztályozás alapú technikák a spam-bot és spam profil és futásidejű osztályozás alapján. Klaszterezési technikák a Markov klaszterezésre összpontosítanak a társadalmi gráfokon és a SOM tanulási algoritmus, míg a felismerési és eltávolítási technikák inkrementális klaszterezésen alapulnak, amelyet osztályozás követ. Az osztályozási és monitorozási technikák a közösségi hálózat alapú Social Spam Guard-ra összpontosítanak, és a felügyelet nélküli felismerési technikák a HITS alapú keretrendszerre.

Vélemény spam

Review Spam is a type of spam that appears as reviews on various e-commerce websites. Positive reviews can boost a company’s business, but negative reviews can harm it. Some spammers intentionally véleményeket tesz közzé, hogy károsítsa egy termék vagy cég hírnevét, és robotok is generálhatják ezeket a véleményeket. 2013-ban egy modellt terveztek szintetikus vélemények generálására. Egy új védekezési módszert javasoltak, hogy felismerjék a különbséget a hamis és igaz vélemények szemantikai áramlása között, amelyeket nehéz felismerni a meglévő módszerekkel.

Jelenleg több spam elleni technika létezik a vélemény spam felismerésére, beleértve:

  • Osztályozás alapú technikák, amelyek lineáris kernel SVM-re és n-gram alapú módszerekre összpontosítanak.
  • Szabály alapú technikák.
  • Időérzékeny jellemző alapú technikák.
  • Kombinált technikák keretrendszerek alapján az osztályozásra és klaszterezésre.
  • Osztályozás alapú technikák, amelyek szintetikus vélemények generálására és elemzésére összpontosítanak.
  • Loopy Belief Propagation (LBP) hálózat alapú technikák.

Helykeresési spam

A kiberbiztonsági kutatások szerint a spammerek képesek behatolni és megzavarni egy érvényes keresőrendszert azáltal, hogy nem kapcsolódó címkéket társítanak dokumentumokhoz, vagy akár véletlenszerűen infúzióval dokumentumokat helyhez kapcsolódó kifejezésekkel. Egy módszertan a spam felismerésére egy helyalapú közösségi könyvjelző weboldalon, a Foursquare-en, kifejlesztésre került ennek a kérdésnek a kezelésére. A Foursquare lehetővé teszi a felhasználók számára, hogy tippeket hagyjanak különböző helyekről és látnivalókról, amelyeket más felhasználók elérhetnek. Azonban a spammerek irreleváns tartalmat, például üzleti tippeket tesznek közzé, amelyek félrevezetik a felhasználókat, akik egy adott helyről szeretnének megtudni.

Ez a dokumentum elemzi a javaslat spammereket, célja, hogy automatizált eszközöket fejlesszen ki a spam javaslatokat közzétevő felhasználók felismerésére. A helykeresési spam elleni technikák osztályozásra és klaszterezésre alapulnak, amelyek a Random Forest és Döntési Fa alapú osztályozásra, EM klaszterezésre a kategorizálásra és Random Forest osztályozásra összpontosítanak.

Megjegyzés spam

A megjegyzés spam elterjedt a közösségi média platformokon, különösen a YouTube-on és a híroldalakon. Egy adatbányászati megközelítést javasoltak a spam megjegyzések szűrésére a YouTube fórumokon, hogy megküzdjenek ezzel a kibertámadással. A spam felismerésére szolgáló tartalomelemzéssel ellentétben ez a megközelítés a megjegyzés viselkedését használja a spammerek azonosítására. A módszertan kihasználja a YouTube’s hasSpamHint feature amely a felhasználói megjegyzéseket kíséri. Íme a lépések:

  1. Kérje le a hasSpamHint jelzéssel ellátott megjegyzéseket egy adott videóhoz.
  2. Vegye ki a gyanús spam megjegyzések mögötti felhasználói azonosítókat, hogy információt gyűjtsön a felhasználói megjegyzés tevékenységről.
  3. Származtasson attribútumokat, mint például a megjegyzés szövegét, időbélyegét, a megjegyzett videó VideoID-jét és a hasSpamHint bináris változó értékét a használati naplóból a vitafórumokon.
  4. Számítsa ki a változók értékeit, amelyek a felhasználó spam szándékát jelzik.
  5. Adjon pontszámot a felhasználónak, hogy azonosítsa őket spammerként vagy sem.
  6. Apply a specific rule derived from manual data inspection to mark any user who meets the rule’s conditions (with at least five comments) as a spammer.

Ezt a spam elleni technikát Szabály alapú és NLP által indukált Téma Hasonlóság a bejegyzésekben és megjegyzésekben, amelyet osztályozás követ.

Keresztmédia spam

A keresztmédia spam egy egyedi spam elleni módszertan, amely felismeri a spamet különböző platformokon. Magában foglalja a spam gyors azonosítását minden közösségi hálózaton és a spam felismerési pontosságának növelését egy nagy adathalmaz részvételével. Bár egyetlen hatékony stratégia nem alkalmazható a spam minden formájára és platformjára, ez a technika egy innovatív keresztplatform keretrendszer a közösségi spam felismerésére.

Ez a technika három fő komponensre oszlik:

  1. Térképezés és összeszerelés a specifikus közösségi hálózati objektum keretrendszer által meghatározott standard modellé alakításával.
  2. Előszűrés feketelisták, hash-elés és hasonlóság összehasonlítás alapján, hogy összehasonlítsa a bejövő objektumokat ismert spam objektumokkal.
  3. Osztályozás felügyelt gépi tanulási technikák alapján a bejövő és társított objektumok osztályozására.

Következtetés

A spam széleskörű probléma az interneten, és spam elleni technikákat fejlesztettek ki és valósítottak meg különböző platformokon, változó sikerrel. Ezek a technikák általában determinisztikus, valószínűségi vagy gráf alapú algoritmusokba sorolhatók, de minden kategóriának jelentős variációja van. A valószínűségi megközelítések a leggyakrabban használtak a modern technikákban, mivel a közösségi hálózatok jellemzői jelentősen eltérnek a standard dokumentumok vagy weboldalak jellemzőitől. Azonban a spam elleni küzdelem soha véget nem érő játék, mivel a spammerek új módszereket fejlesztenek ki a felismerés elkerülésére.

Ezért a folyamatos éberség és új és jobb spam elleni technikák kifejlesztése elengedhetetlen a spam hatékony leküzdéséhez.

szerző avatár

biztonság

admin a Government Technology vezető munkatársa. Korábban a PYMNTS és a The Bay State Banner számára írt, és a Carnegie Mellon Egyetemen szerzett B.A. diplomát kreatív írásból. Boston környékén él.

hu_HUHungarian