Hvordan bruke DALL-E 2 nevrale nettverk
Miscellanea / / July 26, 2023
Vi forstår hva som er fordeler og ulemper med systemet og hva som skal angis i forespørsler.
Hva er DALL-E
DALL-E er et nevralt nettverk fra OpenAI som genererer bilder basert på tekstforespørsler og kan også lage bildevariasjoner basert på brukerforeslåtte eksempler.
Verktøyet er designet basert på modellen GPT-3, som i tillegg ble opplært til å lage grafisk mennesker, dyr, samt et stort antall andre objekter. Tjenesten er også i stand til å kombinere ikke-relaterte konsepter for å danne nye ideer.
Den første versjonen av DALL-E ble utgitt i 2021, og et år senere introduserte utviklerne en forbedret versjon av DALL-E 2, som støtter høyere bildekvalitet og avanserte alternativer for konvertering av ferdige bilder.
Systemet definerer spørringer på hundrevis av språk, inkludert russisk. Men hovedspråket for effektive kommandoer er engelsk. Først gjenkjenner det nevrale nettverket teksten som er skrevet inn av brukeren og genererer en enkel skisse fra den, konverterer den deretter til den endelige versjonen av en liten oppløsning og skalerer den opp og legger til detaljer.
Hva DALL-E 2 nevrale nettverk kan gjøre
Som nevnt ovenfor kan modellen fra OpenAI ikke bare generere bilder på forespørsel, men også lage prosjekter ved å blande ulike konsepter. Det nevrale nettverket forbinder to rammer og danner en annen fra dem.
Ved å bruke Outpainting-funksjonen kan du tegne bakgrunn Bilder. Det er interessant å komplementere ferdige malerier eller fotografier, utvikle nye historier på dem. Det er også mulig å endre komposisjonen, redigere skyggene og teksturen til bildet, legge til og fjerne objekter i rammen.
En av funksjonene til DALL-E 2 er å jobbe med nedlastede filer. Ved å bruke et brukervennlig minimalistisk grensesnitt er det enkelt å legge til elementer i bilder, generere fantastiske landskap eller øke detaljene i bildene.
Hva er ulempene med DALL-E 2
For øyeblikket er ikke DALL-E 2 et perfekt instrument. For å få gode resultater må du eksperimentere, prøve forskjellige søk og justere parameterne. Det nevrale nettverket produserer med jevne mellomrom morsomme eller til og med skremmende rammer med forvrengte objekter og feil arrangement av elementer.
Systemet tar spesielt ofte feil hvis du gir det lenge forespørsler og gir for mange spesifikke detaljer. Den definerer ikke faglige begreper særlig godt, og blir også forvirret ved å bruke negasjoner eller ekskluderinger i stedet for direkte indikasjoner på hva som bør være i rammen.
Slik bruker du DALL-E 2
Du kan begynne å bruke systemet på OpenAI-nettstedet på seksjon DALL E 2ved å trykke på Prøv DALL-E 2-knappen. Hvis du ennå ikke har en konto på siden, kan du få den via e-postadressen din eller eksisterende Google- eller Microsoft-profiler.
Hvis du prøver å koble til fra Russland, trenger du en VPN og et virtuelt nummer for å registrere deg for en konto. Du kan lese mer om å opprette en konto på OpenAI-nettstedet i materiale om ChatGPT.
Når du er logget på, bør du ha 35 gratis bildegenereringskreditter i en måned. Hver neste måned gis det 15 forsøk. Du kan fylle på saldoen på din personlige konto ved å bruke knappen Kjøp kreditt. Du må betale minimum $15 for 115 forespørsler. Dessverre kan brukere fra Russland ikke fylle opp saldoen direkte nå.
Det er flere alternativer for å løse problemet: spør en venn med riktig tilgang til betalingssystemet om å betale regningen eller oppgi en konto for en stund, finn og kjøp en ferdig OpenAI-profil gjennom online handelsplattformer eller bruk andre tjenester på DALL-E base.
Det mest praktiske alternativet Microsoft bildegenerator. Dette verktøyet kjører på DALL-E 2-algoritmer og gir nesten de samme resultatene gratis. Men den har ingen modus. bilderedigering, fullføring av rammen og andre nyttige funksjoner. Analogen kan kun brukes til å generere bilder, og deretter korrigere resultatet med andre programmer. Du trenger en Microsoft-konto og en VPN for å bruke den.
Det er bedre å lage en forespørsel om generering både på DALL-E 2-nettstedet og i bildegeneratoren på engelsk, men på russisk gir systemet også gode resultater. Overrask meg-knappen, som er plassert ved siden av inngangslinjen, vil automatisk sende en uvanlig forespørsel om å teste det nevrale nettverket.
For å få et kvalitetsresultat, bruk spørringer som tydelig beskriver ønsket ramme, men uten unødvendige detaljer. Skriv inn bildetypen i inndatalinjen. Det kan være et portrett, et akvarellbilde, en blyantskisse og lignende.
Spesifiser også belysningsalternativet i rammen og stilen. For eksempel en realistisk visning, som i en tegneserie, eller en bestemt stil til en kjent kunstner. Det er ønskelig å supplere dette med et omtrentlig lysstyrkenivå.
På slutten av linjen kan du legge til konteksten for det som skjer. For eksempel at rammen inneholder ikke bare måne-roveren, men også øyeblikket når den beveger seg mot jordens bakgrunn. Eller en scene der plysjharer kjemper mot romvesener.
Forespørselen trenger ikke å inkludere alle elementene, resultatet kan fortsatt være interessant, men suksessraten vil være merkbart lavere. Bidra til å bygge et vellykket team spesialiserte verktøy, for eksempel Promptomania.
Les også🖼️🤖💬
- Hvordan bruke ChatGPT i Telegram og raskt få svar på spørsmål uten nettleser
- Mer enn 100 tjenester basert på nevrale nettverk for en rekke oppgaver
- 7 nevrale nettverksverktøy for å forbedre videokvaliteten
- 6 tjenester basert på nevrale nettverk for å forbedre lydkvaliteten
- 10 nyttige plugins for ChatGPT