Hvordan finne ut at teksten er skrevet av et nevralt nettverk
Miscellanea / / August 21, 2023
Kunstig intelligens er en god assistent på mange områder. Men du bør ikke stole på ham ubetinget.
Av data Bloomberg bruker omtrent 30 % av spesialistene nevrale nettverk for å generere tekst. I Russland, 67% av de spurte ønsker å søke i arbeidet med kunstig intelligens for å jobbe mindre og ikke miste inntekt. Det er nettopp slik statistikk gleder ikke alle kunder. Noen stoler ikke på nevrale nettverk, så de foretrekker at tekster ikke er skrevet av roboter, men av mennesker.
Vi forstår hvorfor kunder er på vakt mot teknologier og hvilke midler som finnes for å avsløre nevrotekster i dag.
Hvorfor tekster fra nevrale nettverk bør behandles med forsiktighet
Her er hovedgrunnene til at kunder er på vakt mot slike artikler.
Risiko for brudd på opphavsretten
I dag er det ingen offisiell stilling til spørsmålet om hvem tilhøre opphavsrett for tekster laget ved hjelp av AI. I følge loven er en forfatter en person som skaper et verk ved skapende eller åndsverk. Imidlertid, i tilfelle av nevrale nettverket folk gir bare instruksjoner, men skriver ikke selv.
Siden nå loven ikke anerkjenner nevrotekster som gjenstander for opphavsrett, er reglene for bruk av innhold generert av teknologier bestemt i brukeravtalen til det nevrale nettverket.
Og hvis OpenAI sender rettigheter til teksten selv i gratisversjonen, deretter Gerwin grenser dens bruk til politiske, diskriminerende formål eller i ugunstig reklame. Og i midt på reisen bruke innholdet til kommersielle formål Kan bare hvis produktet er generert til en betalt pris.
Risiko for å få ikke-unik eller unøyaktig informasjon
Det nevrale nettverket mottar en forespørsel, sender den gjennom algoritmer, analyserer informasjonen som er tilgjengelig om emnet og gir et svar. Uten å benekte at samme forespørsel fra en annen bruker kan produsere en lignende eller lignende tekst.
Og her kommer en ny fare. Forskere ved Cornell University kom opp med konklusjon: hvis svarene til det nevrale nettverket på det samme spørsmålet varierer veldig, så kommer det med stor sannsynlighet med fakta.
Risikoen for at nevrotekster vil senke bedriftens ressurs i søkeresultatene
På slutten av fjoråret, Googles kvalitetsspesialist Duy Nguyen erklærtat selskapet har på plass algoritmer for å oppdage og nedgradere innhold som er opprettet kunstig intelligens. Derfor frykter mange at søkemotorer vil se etter slikt innhold og pessimisere det. Det vil si å senke posisjonen i søkeresultatene.
Presedensene eksisterer allerede. For eksempel brukte markedsfører Neil Patel eksperimentved å lage 50 testnettsteder, som han delte inn i to grupper. Eksperten fylte sidene til den første delen med artikler laget utelukkende av kunstig intelligens. Nettstedene til den andre var vert for AI-artikler modifisert av mennesker, samt materiale skrevet av tekstforfattere uten bruk av nevrale nettverk.
Resultatene av eksperimentet viste at ressursene til den første gruppen mistet flere posisjoner i søkeresultatene. Og det førte til avta trafikk opptil 70 %.
Samtidig la Google-representanter til at de har en positiv holdning til utviklingen av nevrale nettverk og allerede har opprettet sine egne Chatbot Bard. Men for bedriften er kvalitetstekster en prioritet. Systemet, som rangerer resultatene, tilbyr først og fremst brukere materialer som møter standarder E‑E‑A‑T (erfaring, kompetanse, troverdighet, troverdighet).
Tekster som tilsvarer dem vekker tillit og anses som nyttige fordi de inneholder eksempler, erfaring, en analytisk del og forskning. Og innholdet som nevrale nettverk skaper, uten ytterligere dyp raffinement av en person, er ofte ikke slik.
I mellomtiden, i statsdumaen foreslått introdusere merking for materialer laget ved hjelp av AI. Inntil det skjer, bestemmer du at teksten generert av et nevralt nettverk, må gjøre det selv. Eller ved hjelp av spesialtjenester.
Hvordan bestemme selvstendig at teksten ble skrevet av et nevralt nettverk
MIREA Technological University holdt nylig eksperiment, som ble deltatt av 20 lærere og over 200 elever. Halvparten av dem skrev vitenskapelige artikler på egen hånd. Og de andre 50 % brukte hjelp av nevrale nettverk. Lærere, derimot, måtte beregne slike AI-materialer.
For å gjøre dette tok lærerne hensyn til de stilistiske og ortografiske trekkene til teksten. For eksempel for et stort antall repeterende ord og betydninger, faktiske og logiske feil, mangel på originale dommer. På denne måten klarte lærerne å identifisere 96 % av arbeidet skrevet ved hjelp av det nevrale nettverket. 4 % av elevene som ikke ble eksponert innrømmet at de brukte mange timer på å redigere AI-tekst.
Det er ingen universell instruksjon som hjelper til med å beregne teksten generert av det nevrale nettverket. Eksperimentet viser imidlertid at lignende mønstre er iboende i slike materialer. La oss vurdere dem mer detaljert.
Gjentakelser av betydninger og ord
En av grunnene til at et nettsted senkes i søkeresultatene er re-optimalisering av søkeord. Det nevrale nettverket som svar på en forespørsel "svarer ofte i en sirkel". Noen ganger bruker hun forskjellige forekomster, men betydningen gjentas likevel.
Så, i skjermbildet nedenfor, fikk kunstig intelligens i oppgave å skrive et salgsinnlegg om en ny, skånsom måte å farge hår på. Og i en liten tekst gjentok det nevrale nettverket de samme tesene gjentatte ganger.
Nesten hver setning generert tekst uttrykket "en ny måte å farge" gjentas. Og det er også en gjentatt duplisering av betydninger om sikkerheten til metoden og en individuell tilnærming, som vil understreke det unike til hver klient.
Her er noen sitater fra teksten som illustrerer dette: "forvandle bildet ditt og uttrykk din individualitet", "ta hensyn til din individualitet", "egnet for deg", "skap for deg unikt og stilig utseende", "gjør frisyren din unik", "bevar helsen og glansen til håret ditt", "trygt for håret ditt", "pleie håret ditt, bevar det Helse".
I mellomtiden var det nok å nevne en gang at en ny prosedyre ble presentert i salongen - sparsom fargemetodesom vil holde håret i live. Og forklar også hvordan metoden fungerer, hva som er nyheten og hvorfor den er trygg. Og legg til at fargepaletten er mangfoldig, og mesterne som har blitt trent vil ikke bare utføre farging med høy kvalitet, men vil også hjelpe med valg av farge.
Tilstedeværelsen i teksten av et stort antall frimerker og klisjeer, mangelen på sanseopplevelse
Fargeeksemplet viser også at et nevralt nettverk ikke kan imitere hvordan en person snakker i det virkelige liv. Folk forsegler, bruk slang og forkortelser, med vilje forvrenge ord. En slik presentasjon bidrar til å tiltrekke seg oppmerksomhet, vekke følelser, formidle forfatterens posisjon, hans sanseopplevelse.
Forskning vis: det nevrale nettverket deler ikke følelser, aksepterer ikke noens posisjon. Derfor foretrekker han nøytralitet, klisjeer og klisjeer. I eksemplet ovenfor er dette «faglige ferdigheter», «materialer av høy kvalitet», «unik mulighet».
Samtidig genererer det nevrale nettverket tekster i forskjellige stiler. Du kan for eksempel gi henne oppgaven med å utarbeide et materiale om emnet «Hva påvirker kostnadene ved olje». Men for å presisere at teksten ikke skal skrives på et tørt språk, men med tillegg av metaforer og sammenligninger. Resultatet er imidlertid fortsatt kunstig. Tross alt har AI ingen mål, den "føler" ikke teksten slik en person gjør.
1 / 0
2 / 0
Et av avsnittene vil bidra til å se at det oppnådde resultatet ikke kan sammenlignes med intonasjonen som ligger i en person: «Etterspørsel og tilbud er som en dans av to elskere på oljemarkedet. Hvis etterspørsel etter olje stiger som et rasende hav, og hvis tilbudet ikke holder tritt, går prisene opp som champagne på en nyttårsfest. Men hvis etterspørselen går ned og tilbudet går opp, kan prisene falle som en ballong på et barneselskap."
Teksten virker kunstig, og de fleste svingene i den er malplasserte. Og selv om innlegget virkelig viste seg å være "ikke tørt", er det vanskelig å forestille seg at en ekspert ville ha skrevet på denne måten. I tillegg er bokstavelig talt hver setning en metafor og sammenligning. Slike teknikker bør imidlertid være presise og pent innebygd i teksten. Ellers vil mening gå tapt bak et overskudd av bilder.
Tilstedeværelse av meningsløse fraser og mangel på logikk
Lingvist Noam Chomsky bemerker i sin bok Syntactic Structures at den grammatisk korrekte konstruksjonen av setninger i en setning ikke garanterer tilstedeværelsen av logikk og mening. Som et eksempel nevnte eksperten uttrykket fargeløse grønne ideer sover rasende – «fargeløse grønne ideer sover rasende».
Algoritmer hjelper det nevrale nettverket til å bygge korrekte setninger når det gjelder grammatikk. For AI er det imidlertid ikke noe begrep om "mening". Og det kan ha sin egen logikk for hvert avsnitt, siden materialet er hentet fra forskjellige kilder.
For eksempel ble et nevralt nettverk bedt om å generere anmeldelser for en dusjsåpe og treningsdress. Teksten om klær ble slik: «Ved hjelp av en dress kan du slappe av, fordype deg i sportens verden og også gå en tur. Den har temperaturkontroll, takket være at du føler deg komfortabel i enhver situasjon.
Og her er en anmeldelse av dusjsåpen: “Fantastisk gel, lekker ikke, tynger ikke ned huden. Pakket i pose, i boks, med lokk. Du trenger ikke vente på noe ekstra slik at den smuldrer opp litt. Kan brukes som nattdusjsåle.
Noen setninger i dem velbygget, men virker samtidig absurd og ligner Chomskys illustrasjon.
Mangel på tekstur og overfladiske eksempler
Kunstig intelligens gir åpenbar informasjon i tekstene, generelle fakta, bruker strømlinjeformede fraser og eksempler som ikke avslører spørsmålet mye. I dette tilfellet spiller ikke kompleksiteten til emnet noen rolle. Spørsmålet kan være dypt, for eksempel utviklingsutsikter inneslutninger i Russland. Eller mer enkelt og individuelt, angående valg av teknikk.
I teksten om inkludering fortalte det nevrale nettverket hvor viktig og relevant dette temaet er. Hun la også til at inkludering er en lang prosess, ledsaget av vanskeligheter, men det jobbes med å legge forholdene til rette for mennesker med spesielle behov. Og oppsummert: hvis du ikke stopper, vil utviklingen sikkert være det.
Det som er skrevet svarer imidlertid ikke på spørsmålet. Det er viktig at teksten er konkret. Du kan for eksempel analysere hvilke av de vedtatte lovene som fungerer og hvilke som ikke gjør det, og hvorfor. Å avsløre utenlandsk erfaring. Og forklar hvilke konkrete grep staten, næringslivet og enhver person fortsatt kan ta for å utvikle inkludering.
I teksten om kjøpe en smarttelefongenerert av det nevrale nettverket, er de åpenbare seleksjonsfaktorene også indikert. For eksempel: du bør bestemme deg for operativsystem (iOS eller Android), merke, lese anmeldelser og tekniske spesifikasjoner, og også ta hensyn til dine egne evner.
1 / 0
2 / 0
Imidlertid forstår folk dette. En annen ting er å snakke om brikkene til operativsystemer, for å indikere begrensningene som eksisterer for øyeblikket. Eller nevne innovative løsninger – for eksempel eSIM-teknologi, som lar deg ha opptil fem numre i én smarttelefon. Eller del overprisede enhetsmodeller og deres motparter til den beste prisen.
Forvrengning av fakta, tillegg av oppfunnet informasjon
Det nevrale nettverket svarer plausibelt på nesten alle spørsmål, og gir en kronikk, datoer, etternavn, opprinnelseshistorie. I dette tilfellet er informasjonen forvrengt eller fullstendig oppfunnet. En slik feil i arbeidet til AI kalles en hallusinasjon.
Så det nevrale nettverket fikk i oppgave å fortelle om de berømte døve menneskersom ga et stort bidrag til samfunnsutviklingen. Som et resultat oppfant AI de fleste av dem.
1 / 0
2 / 0
For eksempel astronaut Raymond Lou eller bokseren Mario Gallegos. Og USAs 42. president var fortsatt ikke Matthew Clinton, men Bill Clinton. Og han mistet ikke hørselen.
I tillegg svarte AI trygt på forespørselen "skriv et innlegg om kreativt amnesi». Selv om det ikke finnes et slikt begrep.
På spørsmål om hvorfor boten finner opp mennesker og snakker om ikke-eksisterende termer, beklager han bare mulig forvirring.
1 / 0
2 / 0
Når falske fakta er flettet sammen med sanne data, er det vanskeligere å oppdage nevrale nettverkshallusinasjoner. Spesielt når flytende lesing. Men hvis du konsentrerer deg om eksemplene gitt i teksten, kan du legge merke til de som ser mistenkelige ut og sjekke dem ved å skrive dem inn i søkefeltet.
Mangel på oppdatert informasjon om aktuelle endringer, hendelser
Nevrale nettverk lærer seg selv når de kommuniserer med brukere, husker avklaringene til en person, hans reaksjon på det genererte innholdet, eksempler som en person deler med en bot. Eksperter bemerketat AIs evne til å lære seg selv kom overraskende på dem. Og at denne ferdigheten hjelper nevrale nettverk med å forbedre seg.
Hvori maskinlæring, utført av utviklere på gigabyte med data - artikler, bøker, tekster fra nettet - har en klar begynnelse og slutt. Og i utgangspunktet har ikke nevrale nettverk tilgang til søkemotorer. Derfor er informasjonen som dukket opp etter opplæringen utført av utviklerne ikke tilgjengelig for AI før neste trinn.
Samtidig er intervallet mellom maskinlæring måneder, og noen ganger år. Fremgangen står selvfølgelig ikke stille: for eksempel i mai i år ble GPT Plus tilgjengelig for brukere med et betalt abonnement ChatGPT med internettilgang. Imidlertid har de fleste nevrale nettverk, spesielt deres gratisversjoner, ennå ikke en slik mulighet.
Så basen til gratisversjonen av ChatGPT4 er begrenset til 2021, så boten vet ikke hvem som vant det siste verdensmesterskapet i 2022. Og Googles nevrale nettverk - Bard AI - innrømmet at det ikke kunne komponere en tekst om viktige hendelser som fant sted i verden i sommer.
1 / 0
2 / 0
Siden hennes siste trening ble gjennomført av utviklerne i mai 2023, har sommeren ennå ikke kommet for Bard AI.
I slike tilfeller kommer nevrale nettverk vanligvis ikke med fakta, men innrømmer at de ikke kan "forutsi fremtiden».
Hvis teksten ikke inneholder oppdatert informasjon om emnet eller den ser skilt fra virkeligheten, siden mye har endret seg nylig, er det en mulighet for at materialet ble skrevet av et nevralt nettverk.
Hvilke tjenester kan hjelpe
Teksten generert av kunstig intelligens kan også gjenkjennes ved hjelp av selve nevrale nettverket. Det kan for eksempel bot GPT-4. Spesielle tjenester som kan oppdage AI-algoritmer kan også hjelpe. La oss se på noen av dem nedenfor.
- Text.ru. Nettstedet er posisjonert som en utveksling for copywriting og anti-plagiat. Men nylig dukket det opp en betalt nevro-assistent på portalen. En av funksjonene er en AI-detektor. Teksten som skal sjekkes skal lastes inn i vinduet. Etter noen sekunder vil systemet gi resultatet.
- PR CY. Du kan laste opp tekster fra 1000 tegn til tjenesten. Samtidig er det avklaringer på portalen: spam-alternativer av lav kvalitet som en person skrev, vil systemet se på som et resultat av AI-arbeid. Samt tekster med lyse stilistiske farger - for eksempel lignende verk Majakovskij.
- GPTZero. Verktøyet leser kompleksiteten, kombinasjonen av ord, struktur og lengde på setninger. Men hvis tjenesten takler tekster på engelsk godt, gir den ofte en feil når du laster inn russiskspråklig materiale. Av fordelene - tilstedeværelsen av en gratisversjon.
Et nevralt nettverk kan være en god hjelper. For eksempel når du leter etter ideer. Det er imidlertid farlig å stole fullstendig på innholdet hennes. Du bør behandle AI-materiale på en ansvarlig måte: rediger spam, se etter nøyaktighet, logikk og relevans av fakta. Og juster stilen til det "menneskelige" språket, for ikke å skremme publikum, lagre omdømmet og posisjonen til selskapet i søkeresultatene.
Les også🤖
- 6 grunner til at du ikke blindt bør stole på kunstig intelligens
- Hvordan legge til en bot i Discord
- 6 nevrale nettverk for å lage logoer