ה-Incredible Photo AI החדש של גוגל הופך את 'זום ושפר' לדבר אמיתי

(מחקר של גוגל)

יתכן וראיתם סרטי מדע בדיוני או תוכניות טלוויזיה שבהן הגיבור מבקש להתקרב לתמונה ולשפר את התוצאות - חשיפת פנים, או לוחית מספר, או כל פרט מפתח אחר - והחדש ביותר של גוגלבינה מלאכותיתמנועים, המבוססים על מה שמכונה דגמי דיפוזיה, מסוגלים לממש את הטריק הזה.

זהו תהליך שקשה לשלוט בו, כי בעצם מה שקורה הוא שמתווספים פרטי תמונה שהמצלמה לא צילמה במקור, תוך שימוש בכמה ניחושים סופר-חכמים המבוססים על תמונות אחרות בעלות מראה דומה.

הטכניקה נקראת סינתזת תמונה טבעית על ידי גוגל, ובתרחיש המסוים הזה, רזולוציית-על של תמונה. אתה מתחיל עם תמונה קטנה, גושית ומפוקסלת, ומסיים עם משהו חד, ברור וטבעי למראה. זה אולי לא מתאים בדיוק למקור, אבל זה מספיק קרוב כדי להיראות אמיתי לזוג עיניים אנושיות.



(מחקר של גוגל)

גוגל חשפה למעשה שני כלי AI חדשים לתפקיד. הראשון נקרא SR3, או רזולוציית על באמצעות חידוד חוזר , וזה עובד על ידי הוספת רעש או אי-חיזוי לתמונה ולאחר מכן הפיכת התהליך והורדה ממנו - בדיוק כמו שעורך תמונות עשוי לנסות לחדד את צילומי החופשה שלך.

'מודלים של דיפוזיה פועלים על ידי השחתת נתוני האימון על ידי הוספה הדרגתית רעש גאוסי , למחוק לאט פרטים בנתונים עד שהם הופכים לרעש טהור, ואז להכשיר רשת עצבית להפוך את תהליך השחיתות הזה,' מסבירים מדען המחקר ג'ונתן הו ומהנדס התוכנה צ'יטוואן סהרה מ- מחקר של גוגל .

באמצעות סדרה של חישובי הסתברות המבוססים על מסד נתונים עצום של תמונות וכמה למידת מכונה קסם, SR3 מסוגל לדמיין איך נראית גרסה ברזולוציה מלאה של תמונה חסומה ברזולוציה נמוכה. אתה יכול לקרוא עוד על זה בעיתון שגוגל פרסמה בו arXiv .

הכלי השני הוא CDM, או דגמי דיפוזיה מדורגים . גוגל מתארת ​​אותם כ'צינורות' שדרכם ניתן לכוון דגמי דיפוזיה - כולל SR3 - לשדרוג רזולוציית תמונה באיכות גבוהה. זה לוקח את דגמי השיפור ומייצר מהם תמונות גדולות יותר, ולגוגל יש פרסם מאמר גם על זה.

CDM בפעולה. (מחקר של גוגל)

על ידי שימוש במודלים שונים של שיפור ברזולוציות שונות, גישת ה-CDM מסוגלת לנצח שיטות חלופיות להגדלת תמונות, אומרת גוגל. מנוע הבינה המלאכותית החדש נבדק על ImageNet , מסד נתונים עצום של תמונות אימון בשימוש נפוץ למחקר זיהוי אובייקטים חזותיים.

התוצאות הסופיות של SR3 ו-CDM מרשימות. במבחן סטנדרטי עם 50 מתנדבים אנושיים, תמונות שנוצרו על ידי SR3 של פנים אנושיות הובאו בטעות לתמונות אמיתיות בסביבות 50 אחוז מהזמן - ובהתחשב באלגוריתם מושלם צפוי להגיע לציון של 50 אחוז, זה מרשים.

כדאי לחזור ולהדגיש שהתמונות המשופרות האלה אינן התאמות מדויקות למקור, אבל הן סימולציות מחושבות בקפידה על סמך כמה מתמטיקה של הסתברות מתקדמת.

גוגל אומרת שגישת הדיפוזיה מניבה תוצאות טובות יותר מאשר אפשרויות חלופיות, כוללרשתות יריבות יצירתיות(GANs) כי בור שני רשתות עצביות אחד נגד השני כדי לחדד את התוצאות.

(מחקר של גוגל)

גוגל מבטיחה הרבה יותר ממנועי הבינה המלאכותית והטכנולוגיות הנלוות שלה - לא רק במונחים של הגדלה של תמונות של פרצופים ואובייקטים טבעיים אחרים, אלא גם בתחומים אחרים של מודל הסתברות.

'אנו נרגשים להמשיך ולבחון את הגבולות של מודלים דיפוזיה עבור מגוון רחב של בעיות דוגמנות גנרטיביות,' הצוות מסביר .

אודותינו

פרסום עובדות עצמאיות ומוכחות של דיווחים על בריאות, מרחב, טבע, טכנולוגיה וסביבה.