תוך 4 שעות בלבד, הבינה המלאכותית של גוגל שלטה בכל ידע השחמט בהיסטוריה

(זפרלי/Shutterstock המקורי)

שחמט הוא לא משחק קל, בסטנדרטים אנושיים. אבל עבור בינה מלאכותית המונעת על ידי חשיבה אדירה, כמעט חייזרית, ניתן לשלוט בהסטה הטריוויאלית בכמה שעות פנויות.

במאמר חדש, חוקרי גוגל מפרטים כיצד התפתחה האבולוציה האחרונה של AI שלהם, AlphaZero 'ביצועים על אנושיים' בשחמט, לוקח רק ארבע שעות ללמוד את הכללים לפני שהוא מחסל את תוכנית אלוף העולם בשחמט, סטוקפיש.

במילים אחרות, כל ידע השחמט של האנושות – ומעבר לכך – נקלט והועלה על ידי בינה מלאכותית תוך זמן רב בערך שנדרש כדי לנסוע מניו יורק לוושינגטון הבירה.



לאחר שתוכנת רק עם חוקי השחמט (ללא אסטרטגיות), תוך ארבע שעות בלבד שלטה AlphaZero במשחק במידה שהצליחה לשפר את דירוג הגבוה ביותר תוכנית שחמט דג מלאי .

בסדרה של 100 משחקים מול סטוקפיש, AlphaZero ניצחה 25 משחקים תוך כדי משחק לבן (עם יתרון מוביל ראשון), וקטפה שלושה משחקים כששיחקו בשחור. שאר התחרויות היו תיקו, כאשר Stockfish לא רשם ניצחונות ו-AlphaZero ללא הפסדים.

'עכשיו אנחנו יודעים מי האדון החדש שלנו,' אמר חוקר השחמט דיוויד קרמלי, מנכ'ל אתר מדעי השחמט Chessable.

'אין ספק שזה יעשה מהפכה במשחק, אבל תחשוב איך אפשר ליישם את זה מחוץ לשחמט. האלגוריתם הזה יכול לנהל ערים, יבשות, יקומים״.

פותחה על ידי מעבדת ה-DeepMind AI של גוגל, AlphaZero היא גרסה מעובדת וגנרית יותר שלAlphaGo Zero, המתמחה במשחק הלוח הסיני, Go.

DeepMind כברמשכלל AI זה במשך שנים, בתהליך בסטינג אסדרה של אלופי אדםשנפל כמו דומינו לפני הבלתי ניתנים לשליטה,רשת נוירונים 'אלוקים'.

רצף הניצחונות הזה הגיע לשיאו באהצלחה מדהימהבאוקטובר, שבו גרסה אוטונומית חדשה לחלוטין של הבינה המלאכותית - שלומדת רק על ידי משחק בעצמה, אף פעם לא מול בני אדם - ניצחה את כל גלגוליה הקודמים.

לעומת זאת, קודמיו של AlphaGo Zero למדו חלקית כיצד לשחק את המשחק על ידי צפייה במהלכים שנעשו על ידי שחקנים אנושיים.

המאמץ הזה נועד לסייע לבינה המלאכותית המתהווה באסטרטגיית למידה, אבל נראה שזה היה למעשה מגבלה, מכיוון שהלמידה העצמית של AlphaGo Zero הוכיחהיעיל יותר בצורה הרסניתבתחרות של אחד על אחד.

'זה כמו ציוויליזציה של חייזרים שממציאה את המתמטיקה שלה', אמר מדען המחשב ניק היינס מ-MIT גיזמודו באוקטובר.

״מה שאנחנו רואים כאן הוא מודל משוחרר מהטיות והנחות מוקדמות אנושיות. הוא יכול ללמוד כל מה שהוא יקבע שהוא אופטימלי, שאכן עשוי להיות יותר ניואנס מהתפיסות שלנו לגבי אותו הדבר״.

אבל הדברים נעים כל כך מהר בתחום הזה, שכבר ייתכן שההישג של אוקטובר היה מיושן.

בחדש שלהם עיתון , הצוות מתאר כיצד ה-AlphaZero AI העדכני ביותר לוקח את ההסתמכות על משחק עצמי - הנקרא למידת חיזוק - ומיישם אותו עם רצף כללי הרבה יותר שנותן לו מיקוד רחב יותר לפתרון בעיות.

המיקוד הרחב יותר אומר ש-AlphaZero לא משחק רק שח. זה גם משחק שוגי (שחמט יפני) וגם Go - ואולי באופן לא מפתיע, זה לקח רק שעתיים ושמונה שעות בהתאמה כדי לשלוט במשחקים האלה גם כן.

לעת עתה, מדעני המחשב של גוגל ו-DeepMind אינם מגיבים בפומבי על המחקר החדש, שעדיין לא זכה לביקורת עמיתים.

אבל ממה שאנחנו יכולים לדעת עד כה, העלייה המסחררת של האלגוריתם הזה לפסגת הבינה המלאכותית רחוקה מלהסתיים, ואפילו גדולי שחמט מבולבלים מהמחזה שלפניהם.

'תמיד תהיתי איך זה יהיה אם מין עליון ינחת על פני כדור הארץ ויראה לנו איך הם משחקים שח', רב-אמן פיטר היינה נילסן אמר ל-BBC .

'עכשיו אני יודע.'

הממצאים זמינים באתר preprint arXiv .

אודותינו

פרסום עובדות עצמאיות ומוכחות של דיווחים על בריאות, מרחב, טבע, טכנולוגיה וסביבה.