עכשיו, שהסתיים חג הפסח, אני שמחה לומר שעשיתי סדר יסודי למדי. לא, לא במטבח (הוא עוד מחכה...) אלא במקורות המידע שאני אוספת כל ימות השנה, וממתינים לרגע שבו אעמיק בהם קצת יותר. אז בזכות הסדר הזה מצאתי מידע ששמרתי כבר לפני כשלוש שנים, העוסק בהשקתו של מנוע חיפוש סמנטי רב תחומי חדש. ממש בזמן (נס חנוכה מוקדם?) כדי להיות הפרק השישי בסדרה העוסקת בהצגת תוצאות חיפוש מבוסס בינה מלאכותית בצורה ויזואלית.
אנחנו מצויים בתקופה של הצפת מידע: מעל ל - 2500 מאמרים מדעיים ו - 2200 בקשות לפטנטים מתפרסמים מדי יום (כך על פי הרשום כאן, במאמרו של המידען מרכוס זילמן על מנוע החיפוש Ominty). היכולת האנושית להתמודד עם כמות כזו של חומר היא מוגבלת, הן בתחום המקצועי של כל אחד, ועל אחת כמה וכמה בראיה בין תחומית.
טכנולוגיות חדשות, היודעות להתמודד עם כמויות עצומות של מידע (Big Data) ולהבינו במהירות, טכנולוגיות המבוססות על בינה מלאכותית, הן הטכנולוגיות שיהוו ככל הנראה את הבסיס לפתרון לצריכת המידע והבנתו בשנים הבאות. הטכנולוגיה של בינה מלאכותית מתפתחת במהירות בשנים האחרונות, בתחומים רבים ושונים. גם בתחום מנועי החיפוש ניתן לראות יותר ויותר דוגמאות למנועים מבוססי בינה מלאכותית. מרבית המנועים האלה עדין בראשית דרכם, בגרסאות בטא, עם כיסוי חלקי של החומר. אך נראה כי הם אלו שיהפכו למובילים בשנים הבאות על פני מנועי החיפוש המסורתיים.
Ominty מכסה מקורות מידע בתחומי ההנדסה, המדעים, הרפואה, הפיננסים, המשפטים והפטנטים. כמו גם מקורות מידע חדשותיים, ואף ויקיפדיה וסרטוני טד.
המימון ההתחלתי של החברה היה מבוסס על גרנטים של National Science Foundation.
הקשרים בין התוצאות מוצגים גם בצורה ויזואלית לפי פרמטרים שונים כמו מקור המידע, זמן הפרסום, אזור גאוגרפי ועוד.
החיפוש מתבצע עם הכנסת מלות חיפוש, מחבר או פרמטרים נוספים. אולם החיפוש הייחודי של Omnity הוא באמצעות העלאת מסמך שלם למנוע החיפוש - המשמש למעשה כשאילתת החיפוש- באחת משלוש דרכים: גרירת המסמך, העלאתו מהמחשב או באמצעות סימון קטע מהרשת והעלאתו בעזרת Web clipper (ניתן להורידו לדפדפן כרום מכאן - עדין בגרסת בטא). ניתן לבחור באילו מאגרים לפי תחומים ותתי תחומים יתבצע החיפוש.
לאחר קבלת התוצאות הראשוניות אפשר לחדד את החיפוש ולהוסיף מלים (כולל מלים שמוצעות לפי תוכן המאמרים), חוקרים, מוסדות ועוד.
לסיכום, Omnity הוא מנוע חיפוש נוסף המציג דרך חדשה לביצוע חיפוש רב תחומי סמנטי. הטכנולוגיה העומדת מאחוריו, כמו גם במנועי חיפוש דומים שנסקרו בסדרה, נמצאת כעת בתנופת פיתוח, וצפויה לשנות ככל הנראה את הדרך בה נחפש ונצרוך מידע בעתיד.
אנחנו מצויים בתקופה של הצפת מידע: מעל ל - 2500 מאמרים מדעיים ו - 2200 בקשות לפטנטים מתפרסמים מדי יום (כך על פי הרשום כאן, במאמרו של המידען מרכוס זילמן על מנוע החיפוש Ominty). היכולת האנושית להתמודד עם כמות כזו של חומר היא מוגבלת, הן בתחום המקצועי של כל אחד, ועל אחת כמה וכמה בראיה בין תחומית.
טכנולוגיות חדשות, היודעות להתמודד עם כמויות עצומות של מידע (Big Data) ולהבינו במהירות, טכנולוגיות המבוססות על בינה מלאכותית, הן הטכנולוגיות שיהוו ככל הנראה את הבסיס לפתרון לצריכת המידע והבנתו בשנים הבאות. הטכנולוגיה של בינה מלאכותית מתפתחת במהירות בשנים האחרונות, בתחומים רבים ושונים. גם בתחום מנועי החיפוש ניתן לראות יותר ויותר דוגמאות למנועים מבוססי בינה מלאכותית. מרבית המנועים האלה עדין בראשית דרכם, בגרסאות בטא, עם כיסוי חלקי של החומר. אך נראה כי הם אלו שיהפכו למובילים בשנים הבאות על פני מנועי החיפוש המסורתיים.
תמונה 1. https://www.omnity.io/ |
Ominty
Ominty הושק בשנת 2016 לאחר 4 שנות פיתוח. עם מייסדי החברה, שמקום מושבה סן פרנסיסקו, נמנה Brain Sager המשמש גם כמנכ"ל.Ominty מכסה מקורות מידע בתחומי ההנדסה, המדעים, הרפואה, הפיננסים, המשפטים והפטנטים. כמו גם מקורות מידע חדשותיים, ואף ויקיפדיה וסרטוני טד.
המימון ההתחלתי של החברה היה מבוסס על גרנטים של National Science Foundation.
לא רק רשימת מסמכים - מה מיוחד ב - Omnity?
מנוע החיפוש Ominty מבוסס על טכנולוגיות סמנטיות. הוא מאפשר גילוי של קשרים בין מסמכים מורכבים בתחום מסוים או בין תחומים על בסיס ההקשר של הטקסט שלהם (בניגוד למילות חיפוש מסויימות בלבד), גם אם הם לא מצטטים זה את זה או מקשרים זה לזה. הקשר בין המסמכים נוצר על בסיס הבנה של המשמעות של המסמך כולו. טכנולוגיה זו מייתרת למעשה את הצורך במילות מפתח, ופותחת אפשרויות לגילוי מידע חדש גם אם לא יודעים בדיוק באילו מלים להגדירו. הרעיון של צורת חיפוש זו ושל מנוע החיפוש Ominty מוצג כאן בסרטון. כמובן, שתרומתה האדירה של הטכנולוגיה כאן, מעבר לשיטת החיפוש עצמה, היא המהירות העצומה שבה החיפוש מתרחש, דבר שהיה לוקח לבני אדם לבצע במשך שנים ארוכות מתרחש כאן בשניות בודדות.הקשרים בין התוצאות מוצגים גם בצורה ויזואלית לפי פרמטרים שונים כמו מקור המידע, זמן הפרסום, אזור גאוגרפי ועוד.
איך זה עובד?
החיפוש הבסיסי במנוע הוא חופשי. כלים מתקדמים יותר, וכיסוי של מאגרים שאינם חינמיים קיים בתשלום. בשלב ראשון יש להרשם לאתר (בחינם). באחת הכתבות על האתר היה כתוב שרישום עם אימייל אקדמי מקנה גישה מורחבת יותר למידע, בפועל לא ראיתי שיש הבדל אבל אולי בכל זאת קיים.החיפוש מתבצע עם הכנסת מלות חיפוש, מחבר או פרמטרים נוספים. אולם החיפוש הייחודי של Omnity הוא באמצעות העלאת מסמך שלם למנוע החיפוש - המשמש למעשה כשאילתת החיפוש- באחת משלוש דרכים: גרירת המסמך, העלאתו מהמחשב או באמצעות סימון קטע מהרשת והעלאתו בעזרת Web clipper (ניתן להורידו לדפדפן כרום מכאן - עדין בגרסת בטא). ניתן לבחור באילו מאגרים לפי תחומים ותתי תחומים יתבצע החיפוש.
לאחר קבלת התוצאות הראשוניות אפשר לחדד את החיפוש ולהוסיף מלים (כולל מלים שמוצעות לפי תוכן המאמרים), חוקרים, מוסדות ועוד.
תצוגה ויזואלית
בפינה הימנית העליונה יש גישה לתצוגה ויזואלית של תוצאות החיפוש. כאן ניתן לראות את הקשרים בין התוצאות. התצוגה הויזואלית היא לפי רלוונטיות, קהילה, תאריך, מיקום גאוגרפי ועוד.תמונה 2.דוגמה לתצוגה הויזואלית של תוצאות החיפוש ב - Omnity לפי קהילות |
חיפוש: הדור הבא
כלי מדליק שקיים בגרסה בתשלום הוא בניית שאילתא, שבה את מקומן של מילות המפתח תופסים מאמרים. סקיצה של אופציה זו מוצג בתמונה 3.תמונה 3. בונים שאילתה ממאמרים שלמים |