ב-Google I/O ביום שלישי הכריזה החברה על Gemini 1.5 Flash, התוספת החדשה ביותר לסדרת Gemini. גוגל אמרה בפוסט כי הדגם החדש יכול לסכם במהירות שיחות, תמונות כתוביות וסרטונים ולחלץ נתונים ממסמכים. "שמענו ממפתחים שהם רוצים משהו מהיר יותר וחסכוני אפילו יותר", אמר דמיס חסאביס, מנכ"ל Google DeepMind, בתדרוך עיתונאים.
גוגל הכריזה על שני דגמי AI חדשים וחזקים שמטרתם לשנות את הדרך בה אנו יוצרים מדיה. הדגמים האלה, שנחשפו בכנס המפתחים של Google, נועדו לעזור ליוצרים להפיק סרטונים ותמונות באיכות גבוהה יותר בקלות ובדייקנות.
Veo הוא הדגם האחרון והמתקדם ביותר של גוגל ליצירת סרטונים. הוא יכול ליצור סרטונים בחדות גבוהה שאורכם למעלה מדקה. Veo מבין הנחיות מפורטות של שפה טבעית, ומאפשרת לה ליצור במדויק סרטונים התואמים את החזון היצירתי של המשתמש. הוא יכול להתמודד עם הוראות מורכבות כמו "Timelapse" או "צילומי אוויר של נוף".
דגם נוסף הוא מחולל התמונות Imagen 3, גרסה משופרת של מחולל ה-Imagen הקיים של החברה עם יכולת יצירת תמונות באיכות גבוהה בדגש על הפרטים הקטנים. Imagen 3 הוא הגרסה החדשה והמשופרת של מודל ה-Imagen 2, המסוגל לייצר תמונות באיכות גבוהה ופוטוריאליסטית עם דיוק גבוה בפרטים הקטנים, הוא בעל הבנה טובה יותר של קליטת טקסט ליצירת התמונות ויכולת לשלב טקסט בתמונות אותן הוא מייצר.