יום ראשון, 21 ביוני 2020

Connected Papers - כלי ויזואלי חדש לאיתור מאמרים

מה אתם עושים כשאתם פוגשים חברים בסופי שבוע? אולי הולכים לים או יושבים לקפה? ובכן, יש חברים שנפגשים ומפתחים אתרים ופתרונות טכנולוגיים בזמן הזה. והפעם מדובר בחברים ישראלים - אלכס טרנבסקי איתן, אדי סמולנסקי ואיתי כנען הרפז -שחולקים במשך שנים את התסכול, אותו חשים רבים לעתים קרובות בעת ביצוע סקירת ספרות מדעית. וכך, כפרוייקט צדדי בפגישות בסופי שבוע נולד האתר.
הכלי שפיתחו השלושה נקרא Connected Papers , והוא מאפשר לאתר בקלות מאמרים דומים למאמר אחד שכבר יש לכם בתחום מסויים, ואת הקשרים ביניהם. הכלי הושק בראשית חודש יוני השנה, והוא קל ונוח לתפעול, וחופשי לשימוש (כרגע לא נתמך במובייל).

איך זה עובד?

העבודה עם Connected Papers מתחילה בהכנסת פרטי מאמר שברשותכם, שתרצו למצוא מאמרים הדומים לו. ניתן להכניס לכלי את מאמר המקור במגוון דרכים, כולל קישור מ - PubMed או Semantic Scholar, כותרת המאמר או מספר ה - DOI שלו (תמונה 1). 
לאחר זיהוי המאמר, הכלי סורק כ - 50 אלף מאמרים במאגר המידע Semantic Scholar, ומציג את הרלוונטיים ביותר מביניהם (כמה עשרות) בגרף. מכיון ש - Semantic Scholar הוא רב תחומי, הכלי מתאים למגוון תחומי מחקר.

העיקרון המוביל לקביעת הדמיון בין המאמרים הוא חפיפה מקסימלית בין המאמרים המופיעים ברשימות הביבליוגרפיות של שניהם. ככל שיש יותר דמיון בי הרשימות, כך סביר להניח שהמאמרים עוסקים באותו נושא. אין חובה שמאמרים יצטטו אחד את השני כדי לקבוע שהם דומים. ולפי הסבר שקיבלתי מיוצרי הכלי: הרעיון הוא שאם לשני מאמרים יש רשימות רפרנסים דומות אז הם כנראה באותו נושא (Bibliographic coupling). בנוסף, אם מאמרים אחרים מצטטים את שני המאמרים האלה ביחד אז הם גם כנראה באותו נושא (Co-citation).
ומחשבה שלי על הנושא: בדיקת הדמיון בין המאמרים באמצעות הרשימה הביבליוגרפית שלהם, ולא על פי הטקסט המלא שלהם, כמקובל במנועי חיפוש אחרים מבוססי בינה מלאכותית, מאפשרת בדיקה יסודית גם של מאמרים שאין גישה אל הטקסט המלא שלהם, היות והרשימות הביבליוגרפיות של מאמרים הן פתוחות לציבור בכל מקרה. 


תמונה 1. כל הדרכים להתחיל חיפוש ב - https://www.connectedpapers.com/

קריאת הגרף

מטרת הגרף המתקבל לאחר עיבוד המאמר שהוכנס לכלי היא להציג בצורה בולטת את המאמרים החשובים והרלוונטיים ביותר.  כל בועה בגרף מייצגת מאמר. ככל שהיא גדולה יותר, המאמר צוטט יותר פעמים, וככל שהיא כהה יותר המאמר חדש יותר. מאמרים דומים יופיעו בקבוצות (תמונה 2). 

מאמרים מקוריים ומאמרים נגזרים

אפשרות נוספת שקיימת בכלי היא קבלת מאמרים "מייסדים" (Prior works) ומאמרים "נגזרים" (Derivative works). מאמרים מייסדים (Ancestral papers) הם בד"כ מאמרים מקוריים, שהשפיעו ביותר על התחום ועל הדורות הבאים של המחקר. מאמרים נגזרים הם בד"כ סקירות שיטתיות, מטא-אנליזות או מאמרי State of the art המסכמים את הנעשה בתחום. 
אפשרות זו מקלה על זיהוי יסידות התחום הנבדק, ומעקב אחר התפתחותו לאורך השנים. 
המאמרים שמוגדרים כ - Prior/Derivative לא יופיעו בד"כ בגרף עצמו. בלחיצה על מאמר המופיע ברשימת ה- Prior/Derivative יסומנו בכחול כל המאמרים בגרף המצטטים אותו/מצוטטים על ידו, ולחיצה על מאמר המופיע בגרף תסמן בכחול את כל המאמרים ב - Prior/Derivative המצטטים אותו/מצוטטים על ידו (הסימון מופיע הן בתצוגת הרשימה והן בתצוגה הגרפית).

תמונה 2. גרף לדוגמה מ - Connected Papers

מידע נוסף

הספרן והבלוגר מסינגפור Aaron Tay  כתב לאחרונה פוסט מפורט בבלוג שלו על כלים נוספים המשתמשים במידע הביבליוגרפי לאיתור מאמרים, והספיק להכניס גם סקירה מפורטת על Connected Papers. שווה לקרוא את הסקירה ולהכיר כלים נוספים ואת היתרונות והחסרונות שלהם. 

לסיכום

מההתנסות שלי עד כה הכלי פשוט לשימוש, ומסייע למקד מאמרים בנושא מסויים בלי לטבוע בים של חומר. גם האופציה של קבלת מאמרי בסיס ומאמרים מסכמים שימושית. התוספת המתבקשת לכלי, שאחת ממטרותיו היא לסייע באיתור מאמרים לעבודות אקדמיות, היא אפשרות לייצא את המאמרים המתקבלים בחיפוש לתוכנה לניהול ציטוטים. בפניה למפתחי האתר נמסר לי כי הבקשה להוספת אפשרות זו עולה הרבה בקרב המשתמשים, והפרשנות שלי היא כי סביר להניח שאכן נראה אפשרות זו בהמשך. צריך לזכור שהכלי הושק רק החודש, כך שניתן לצפות לחידושים ושיפורים בעתיד. אשמח לשמוע אם התנסיתם בכלי ומה דעתכם?


תגובה 1: