ביקורת הבינה הבינונית

השיחה הראשונה שלי עם ChatGPT עסקה (איך לא) במכונות כביסה, והפיקה ממצאים מאוד מעניינים לטוב ולרע. האם הטכנולוגיה הזו עומדת להחליף את גוגל, את המתכנתים האנושיים ואותי? הנה כמה תצפיות ומחשבות על הבינה המלאכותית שתוקפת אותנו מכל עבר.

כדורים ממכונת כביסה, אחד אמיתי (עם קצת עיבוד תמונה) ואחד של DALL-E

הכדור המסתורי והניחוש ההחלטי

כשמכונת הכביסה החדשה הגיעה, הנחתי (על סמך ניסיון עבר) שעליי להזמין טכנאי מטעם החברה שיתקין אותה, אחרת לא אקבל אחריות. סוף השבוע התקרב, אז השארתי בינתיים את המכונה הקודמת והצולעת במקומה, והתקשרתי ליבואן – שאמר שאם בא לי, אני יכול להתקין את החדשה לבד ועדיין אקבל אחריות. אז עשיתי את זה, ומה נותר לעשות בסוף השבוע מלבד לפרק את המכונה הישנה לגורמים?

באותו זמן גיליתי איך יוצרים קשר עם ChatGPT, צ'ט הבינה המלאכותית שכולם מדברים עליו בהתלהבות ו/או בחשש. "פירקתי מכונת כביסה," סיפרתי לתוכנה [כל הטקסטים להלן בתרגום חופשי שלי], "ומצאתי בפנים כדור. מה לדעתך זה יכול להיות?"

"מיסב כדורי," פסקה הב"מ, הוסיפה הסבר על מיסבים כדוריים באופן כללי ותפקידם, והזהירה אותי שאם מצאתי אחד כזה חופשי בתוך המכונה, ממש לא כדאי לי לנסות להפעיל אותה שוב. נפלא, אלא ש…

"זה לא היה מיסב כדורי," הבהרתי. "זה היה כדור פלסטי, בערך בגודל של כדור פינג-פונג."

"אם כך," השיבה התוכנה, "זה בוודאי מצוף שמשמש כשסתום במערכת הניקוז של המכונה." היא סיפקה עוד כמה פרטים כלליים על תיקון של מכונות כביסה, אבל אני כבר הייתי באופוריה. הדבר הזה מדהים! השיחה הייתה קוהרנטית יותר ממה שחוויתי עם כמה נציגים אנושיים בצ'טים, והמידע, שלדעתי אינו ידע כללי נפוץ, היה נכון כמובן – אכן שלפתי את הכדור מתוך צנרת הניקוז של תוף המכונה הישנה, ממקום שרוב האנשים לא ראו בימי חייהם. מלא התלהבות, התקדמתי לכיוון קצת יותר חופשי:

"האם את יכולה לנחש באיזה צבע הייתה המכונה?"

התשובה לה ציפיתי, על סמך היגיון וסטטיסטיקה פשוטים, הייתה "לבן", או – אופציה יצירתית יותר – "אל תבזבז לי את הזמן אם אתה כבר יודע." אבל לא:

"אני לא יכולה לקבוע מה היה הצבע של מכונת הכביסה."

"לא ביקשתי ממך לקבוע, רק לנחש."

הב"מ הסבירה לי באריכות יחסית מה פירוש המילה "לקבוע" (Determine), ומה זה "לנחש" (Guess) – בין השאר, "להעריך על סמך מידע חלקי". החלטתי להמשיך ולהשתעשע בכיוון הזה.

"בסדר, אז הנה לך מידע חלקי: זה לא היה לבן, אפור או שחור. האם כעת את יכולה לנחש מה היה הצבע?"

"אני לא יכולה לקבוע מה היה הצבע של מכונת הכביסה."

בנקודה זו פרשתי מהצ'ט באכזבה גדולה. זו הבינה המלאכותית המהוללת שכולם מדברים עליה? זה כל מה שנדרש כדי להכשיל אותה?

אדם משוחח עם רובוט על מכונות כביסה, לפי DALL-E

בינה מלאכותית כותבת בלינק אינטראקטיבי

בגדול, יש שני סוגי ביקורות על ChatGPT שנתקלתי בהם ברשת: של אנשים מאוכזבים (הטענה העיקרית שלהם היא שברגע שאתה שואל על תחום שאתה בעצמך מבין בו, אתה מגלה שהתוכנה נותנת מידע מפוקפק ואפילו שגוי), ושל אנשים נדהמים ואפילו מפוחדים, שמפיקים בעזרתה קטע קוד קצר כזה או אחר ובטוחים שעוד מעט היא תחליף את ה"ג'וניורים", המתכנתים האנושיים חסרי הניסיון התעסוקתי שמקבלים מטלות פשוטות יחסית. שני הצדדים מסכימים שהאינטראקציה בשפה טבעית עם התוכנה מדהימה.

חזרתי לצ'ט וביקשתי מהב"מ לכתוב קוד ארדואינו עבור התקן שמהבהב בלד, ומאיץ את קצב ההבהוב בכל פעם שלוחצים על כפתור, מתוך הנחה שזו מטלה פשוטה אבל לא לגמרי טריוויאלית. את הפלט שהתקבל, כולל הניסוח הטוב-יותר של המטלה על ידי ChatGPT, אתם יכולים לקרוא כאן.

מצד אחד, זה אכן מדהים. מי היה מאמין שבימי חיינו נוכל לתאר, במשפט אחד בשפה טבעית, פונקציונליות של תוכנה ולקבל קוד שלם שעושה את זה? מטורף לחלוטין, ובמיוחד אהבתי את תשומת הלב לפרט הקטן, הווידוא שערך ה-Delay לא יירד עד אפס או נמוך יותר. מצד שני, זה קוד דפוק. קודם כול יש בו הנחה סמויה ומסוכנת שהלחצן נותן לנו או high או low, ודבר שני, כיוון שנעשה שימוש בפקודת delay, ייתכן בהחלט שלחיצה קצרה לא תיקלט כלל.

הצגתי את בעייתיות ה-delay הזו בפני הב"מ, שהשיבה שאני צודק (וואלה), הסבירה את הבעיה במילים אחרות (ובצורה דו-משמעית שעלולה להתפרש כשגויה, כביכול הלחיצה תיקלט בכל מקרה בסיום ה-delay) והציעה קוד משופר שאמור להתמודד עמה. הנה הקוד החדש לשיפוטכם. שוב, מצד אחד המוח מתפוצץ מרוב התחכום של כל מה שקרה כאן, ומצד שני, גם הקוד הזה די עלוב. הוא תיקן את הבעיה הקודמת אבל הכניס בדלת האחורית את בעיית ה-bounce, שהיא הדבר הבסיסי ביותר שמשתמש ארדואינו בעולם האמיתי לומד על לחצנים.

מי שיתעקש להתפלסף יכול לטעון שהקוד החדש עדיין עושה בדיוק מה שביקשתי, ואם ההתעלמות מה-bounce לא מוצאת חן בעיניי, זו אשמתי כי לא ציינתי במפורש שצריך לסנן אותו. התשובה שלי היא "את זה תגיד ללקוח, שישאל אותך למה הפרויקט שהכנת לו מתנהג ככה" – ואפשר גם להוסיף ולהקשות, מדוע ChatGPT כן הגבילה על דעת עצמה את קצב ההבהוב המירבי, במקום להגיד לי שהבקשה שלי בלתי אפשרית לוגית (מובילה לקצב הבהוב אינסופי). כתיבה של קוד שצריך לרוץ בעולם האמיתי היא עסק מורכב יותר מאשר חילוץ משמעות נקודתית ממשפט בשפה טבעית. כל קוד נכתב בתוך הקשר רחב, שכולל ציפיות והנחות סמויות גלובליות ולוקליות. אם אני מכיר את כל אלה ומסוגל לבחון קוד ולדעת אם הוא עומד בהן או לא, בשביל מה אני צריך את ChatGPT, שאינה מסוגלת לעשות זאת? חוץ, אולי, מהעובדה שאין לה טעויות הקלדה מטופשות.

לוח ארדואינו מחובר ללד וללחצן, על רקע מסך עם קוד סי פלוס פלוס, גרסת DALL-E

אגב, שאלתי את הב"מ גם כמה לחצנים נפרדים אפשר לקרוא באמצעות לוח ארדואינו אונו. התשובה [בניסוח מקוצר שלי] הייתה "יש 20 פיני GPIO, אז אפשר להשתמש בכולם ולקרוא 20 לחצנים, אבל זכור שלארדואינו יש משאבים מוגבלים וקריאה של יותר מדי ערוצי קלט עלולה לאתגר את כוח העיבוד שלו. מומלץ להשתמש במספר ערוצי קלט קטן ככל האפשר." זו תשובה עם גרעין של אמת, ועם זאת שגויה מכל כך הרבה סיבות, שהמשאבים המוגבלים שלי כאן לא מאפשרים לי אפילו לפרט את כולן.

האם אני דורש יותר מדי מהבינה המלאכותית? האם בעוד שנה או שנתיים היא תשתכלל ותהיה שימושית במידה כזו שאיאלץ לאכול את הכובע? כפי שאני רואה זאת כרגע, התוצרים של בינות מלאכותיות נעשים מהוקצעים ומרשימים יותר ויותר כלפי חוץ (וזה קורה בצעדי ענק), ומאגרי המידע העצומים שמהם הן לומדות מספקים להן הרבה מידע שימושי ברמה השטחית, אך ההתמודדות עם דקויות, עם לוגיקה ויחסים לוגיים של ממש, עדיין בחיתוליה ועדיין נופלת על דברים פשוטים. חברת הייטק שתחליף את הג'וניורים שלה ב-ChatGPT, לא מגיע לה שיעבדו אצלה מתכנתים ראויים לשמם – ומתכנת שהוחלף בהצלחה על ידי ChatGPT, אולי מוטב שהיה בוחר מלכתחילה מקצוע אחר.

איש נבוך אוכל את הכובע שלו, על פי DALL-E

להרשמה

3 תגובות

מהכי חדשה

מהכי ישנה לפי הצבעות

Inline Feedbacks

הראה את כל התגובות

יותם

2 שנים מכתיבת התגובה

היי, תודה על הפוסט!
לגבי התשובות היבשות של gpt, גיליתי שהמילים be imaginative עושות פלאים

להגיב

אודי

הי עידו תודה רבה על הכתבה!
היה מעניין אותי לשמוע איפה אתה חושב שמערכות כאלו יעזור לך בתור מפתח מומחה.
תודה!
אודי

עידו גנדל

מחבר/ת

תשובה ל- אודי

ההתרשמות שלי בינתיים היא שעם מערכות "כלליות" כאלה, אצטרך להשקיע עוד יותר זמן ושיקול דעת מאשר בשיטות הקיימות (לשבת ולחשוב, גוגל, לשאול בפורום מקצועי…) המערכות שיש להן פוטנציאל מבטיח, לפחות בינתיים, הן אלה שממוקדות במשימה אחת ספציפית כגון Autorouting. וגם איתן הייתי נזהר.

הבייט הלבן

ביקורת הבינה הבינונית

הכדור המסתורי והניחוש ההחלטי

בינה מלאכותית כותבת בלינק אינטראקטיבי

בלוג אישי בנושאי מייקינג, תכנות, מיקרו-בקרים ואלקטרוניקה