Die bereiking van konsekwentheid in KI-gegenereerde video's was nog altyd 'n uitdaging. Alhoewel dit eenvoudig is om virtuele modelle en klere te genereer, bly die skep van 'n video waar Elon Musk 'n pelsjas modelleer 'n komplekse taak.
Pika se onlangs bygewerkte 2.0-model bied 'n slim oplossing: deur veelvuldige foto's op te laai, kan Pika na spesifieke elemente verwys om video's met merkwaardige akkuraatheid te genereer.

Deur foto's van mense, produkte en instellings te verskaf, kan gebruikers 'n basiese kommersiële video skep waar die beeldmateriaal nou ooreenstem met die oorspronklike beelde.

Beteken dit dat KI videokonsekwentheid opgelos het, wat nuwe uitdagings vir adverteerders skep? Nie heeltemal nie. Alhoewel Pika pret is om te gebruik, het die praktiese toepassing daarvan nog ruimte vir verbetering.
Skep onwerklike tonele met Pika
Pika se multi-beeld invoer funksie, genaamd "Scene Ingredients," stel gebruikers in staat om foto's te kombineer en unieke scenario's te genereer. Hier is hoe dit werk:
- Laai tot ses prente op deur op die "+"-knoppie te klik.
- Voeg 'n eenvoudige opdrag in die tekskassie.
Kom ons laat Elon Musk en Ultraman byvoorbeeld saam na 'n fliek kyk. Opdrag: Twee mense sit in 'n donker teater, hou springmielies vas en fokus op die skerm met afwagting ...
Laai eenvoudig hul foto's op, en die teater-omgewing word geskep vanaf die aansporing. Terwyl Elon Musk realisties lyk, voel Ultraman se voorkoms oordrewe en ontkoppel van die oorspronklike foto.

'n Opvallende kenmerk van Pika is sy vermoë om elemente te "hergebruik". Ons kan byvoorbeeld Musk en Ultraman in bypassende groen jasse aantrek en 'n modefotosessie skep.
Die foto's van die twee mense is albei van klaargemaakte beelde verkry. Die groen jas en die ysige sneeu agtergrond is afsonderlik gegenereer deur gebruik te maak van KI, met die "AIGC" teks op die jas wat as 'n uitdaging vir Pika dien.
Die resultaat het ordentlike konsekwentheid tussen die toneel en die jas getoon, en die "AIGC"-teks was effens herkenbaar. Die houdings van die modelle het ook die instruksies gevolg. Maar die grootste probleem is, wie is hierdie twee mense? Die gesigte in die video en die foto's is dalk nie identies nie, maar hulle is heeltemal onverwant.


Vervolgens het ons Pika se uitrusting-aanpassing getoets deur 'n swart T-hemp te skep met die frase "Ek was mens." Ons het 'n foto van Mark Zuckerberg en 'n foto van 'n ukulele bygevoeg om 'n musiekuitvoering te skep.
Pika het die opdrag goed gevolg, en die kamerabeweging was glad. Die klere is ook soomloos aangetrek, maar die regterhand, veral die duim, is steeds nie perfek nie.


In vergelyking met Google Veo en OpenAI Sora, is Pika se model nie uit die boonste rakke nie. Die oplossing van een probleem openbaar dikwels meer foute.
Nadat ons 'n realistiese styl probeer het, laat ons oorskakel na 'n anime-styl. Om Gintoki Sakata en Naruto Uzumaki in dieselfde raam te hê, kies ek twee beelde met blou lug en wit wolke as agtergrond.
Die agtergrond meng natuurlik, en die uitdrukkings is goed vasgevang, met die wind effek op hare en klere wat mooi pas. Die draai-effek is egter nogal ontstellend. Gintoki se oë lyk leweloos en rol nie werklik terug nie.


Jy kan ook bekende skilderye oor eras heen laat interaksie hê—soos Mona Lisa en die meisie met 'n pêreloorring wat patat by McDonald's eet. Die effek is nie ideaal nie. As jy Mona Lisa sien, wonder mens of Da Vinci in sy graf sou omdraai. Die karakters lyk soos plakkers wat in die video geplaas is, met vreemde kopbewegings.


Soms lewer die terugkeer na eenvoud onverwagse goeie resultate. Die oplaai van 'n Starbucks-prent en 'n Monet's Water Lelies-skildery lei tot 'n "lotus-agtige" koffiebeker.


Om te kompeteer met Chinese vervaardigde modelle, is dit nou makliker om KI-video te beheer
In 'n mate het Pika videobeheerbaarheid verbeter. Alhoewel dit nie heeltemal suksesvol is nie, soos in die praktyk gesien, handhaaf Pika konsekwentheid in tonele, kleredrag en voorwerpe, maar gesigte is geneig om te vervorm ongeag styl.
Boonop moet Pika se basiese vermoëns verbeter word. Optrede soos eet of klavier speel bied steeds uitdagings. Kan hierdie probleme verlig word deur kaarte te trek?
In drie woorde: nie bekostigbaar nie. Pika 2.0 is tans slegs beskikbaar vir Pro- en Fancy-gebruikers, en kos ten minste $35 per maand sonder 'n gratis proeftydperk. Boonop kry Pro-gebruikers slegs 2000 punte per maand, maar die gebruik van die Scene Ingredients-funksie kos 100 punte per video.
Trouens, die Chinees-vervaardigde KI-videomodel Vidu het die "meerbeeldverwysing"-funksie vroeër as Pika geïmplementeer. Meer aantreklik vir gebruikers, dit bied gratis proefpunte.

Ek het van Pika se gevalle op Vidu getoets. Mona Lisa en die meisie met 'n pêreloorring wat patat eet, lyk of hulle pas uit die grond gekom het, maar Mona Lisa se gelykenis is beter as Pika s'n.

Elon Musk en Ultraman kyk saam na 'n fliek, Musk se gesig is omtrent 70-80% akkuraat, maar Ultraman se gesig is steeds nie wonderlik nie.

Gintoki Sakata en Naruto Uzumaki in dieselfde raam, Vidu kan 'n syvlak vanaf 'n voorkant genereer, maar die styl verskil van die oorspronklike beeld.

Boonop het Vidu 'n beperking in vergelyking met Pika - dit kan slegs 'n maksimum van drie beelde oplaai. Dus, toe ek Vidu gebruik het om 'n modesessie vir Musk en Ultraman te skep, het ek net hul foto's en 'n groen jas opgelaai en die agtergrond uitgelaat.
Die resultate het onbekend gevoel. Dit is duidelik dat die handhawing van gesigstabiliteit steeds 'n uitdaging is.

Wanneer Vidu met Pika vergelyk word, kan menings verskil. Pika gebruik 'n professionele weergawe, terwyl Vidu 'n gratis weergawe gebruik, wat verantwoordelik is vir 'n paar verskille. Die benadering van Pika en Vidu is egter soortgelyk—gebruik slegs 'n paar beeldmateriaal en eenvoudige aanwysings om relatief stabiele voorwerpe te genereer.
In KI-videogenerering word die handhawing van vakkonsekwentheid tans meer betroubaar bereik met die LoRA-oplossing. Dit behels die fynafstelling van die model met 'n sekere hoeveelheid spesifieke vakmateriaal. Met voldoende materiaal en opleiding leer die model geleidelik die voorkomskenmerke van die karakter aan.
Maar om KI-video's meer toeganklik en kommersieel waardevol te maak, moet die toegangsversperring verlaag word. Ten minste met Vidu en Pika sien ons die potensiaal.
Gaan viraal met KI-kortvideo's: 'n eenrigtingkaartjie na kreatiwiteit
Kort na die vrystelling van Pika se 2.0-model het internasionale gebruikers reeds 'n ontploffing gehad. Deur herhaaldelik video's in verskillende tonele te genereer deur hul eie foto's te gebruik, kan hulle "onmiddellike heelalreise" bereik. Met KI is dit net 'n klik weg om klere te probeer. Modelle en uitrustings vloei naatloos, wat die koste van regte lote bespaar.
Om met Pika rond te speel, het my 'n gevoel gegee soortgelyk aan die speel van "QQ Show" en "The Sims," waar ons besluit hoe om die karakters in die video aan te trek.
As jy Musk se “droom” wil verwesenlik, is dit maklik. Gebruik eers ander KI-instrumente om 'n "Conquer Mars"-T-hemp en 'n rooi hoed met "MAGA" daarop geskryf te genereer.
Laai dan hierdie beelde, 'n Mars-toneel, Musk se foto, sy Optimus Prime menslike robot en sy gunsteling internetmeme Doge-prototipe op na Pika.
Op die ou end verskyn 'n sonnige en vrolike jong man, met 'n hond aan die linkerkant en 'n robot aan die regterkant, wat vriendelik lyk, maar nie heeltemal soos Musk nie.


Of dit na hy lyk of nie, is een ding; solank jy 'n oop gemoed hou, is die moontlikhede eindeloos. Deur foto's van onsself en bekendes te gebruik, kan ons maklik betrokke raak by fandom. Laai hoede, klere en instrumente op om onsself van kop tot tone aan te trek. Versamel tonele, produkte en modelle, en jy het 'n eenvoudige kommersiële video ...
Foto's + AI-beelde + Pika 2.0 +-opdragte kan baie interessante beeldmateriaal genereer. Hierdie metode vermy ook sommige van die tekortkominge van videomodelle, soos skryf, wat met beeldmodelle opgelos kan word. Sonder om direk met Google se modelvermoëns mee te ding of om met Runway se Hollywood-drome te vergelyk, het Pika sy unieke benadering.
Pika was nog altyd 'n meester van kreatiwiteit, met sy vorige reeks KI spesiale effekte-kenmerke, Pikaffect, wat viraal gegaan het oor platforms soos RedNote en TikTok, wat Pika se gebruikersbasis verby 11 miljoen stoot.


Pika het by 'n groep gebruikers gebruik gemaak met 'n groot aanvraag vir vermaaklike kort video's. Selfs al is hierdie video's sjabloon en vlugtig, solank dit pret is, sal mense na hulle stroom.
Wie sê om te wen gaan alles daaroor om alles te neem? Die KI-mark is groot, en hoewel die simulasie van die fisiese wêreld 'n groot droom is, is die bereiking van die klein doelwit om KI-kortvideo's pret te maak, ook 'n vorm van sukses.
Bron van ifan
Vrywaring: Die inligting hierbo uiteengesit word verskaf deur ifanr.com, onafhanklik van Cooig.com. Cooig.com maak geen voorstelling en waarborge oor die kwaliteit en betroubaarheid van die verkoper en produkte nie. Cooig.com ontken uitdruklik enige aanspreeklikheid vir oortredings met betrekking tot die kopiereg van inhoud.