יום חמישי, 25 ביוני 2020

Preprints in PubMed

פיילוט חדש מתחיל החודש ב - PubMed, במסגרתו יוכנסו מאמרים מסוג Preprints לראשונה למאגר. וובינר מיוחד שהתקיים לאחרונה מתאר את הפיילוט לפרטי פרטים. ה - Preprints שיוכנסו ל - PubMed, דרך מאגר PMC, יהיו של מחקרים שנעשו באמצעות מימון של ה - NIH, במטרה להגביר ולהקדים את החשיפה לממצאיהם. הדגש הראשוני של ה - Preprints שיוכנסו יהיה מחקרים בנושא מגיפת ה - Covid-19, המגיפה שהדגישה את הצורך בפרסום מהיר ונגיש של מידע מדעי. להדגשת המשמעות של פרסום מהיר, פרסום מאמר בדרכים המקובלות לאחר בקרת עמיתים יכול לקחת חודשים ושנים.

מהו Preprint?

בשלב ראשון יש לשאול מהו בעצם Preprint ? מסתבר שקיימות מגוון הגדרות למונח, שמשתנות גם בהתאם לתחום המחקר. הגדרה מקובלת היא  - גרסה מוקדמת של מאמר מדעי, שפורסמה על ידי המחבר/ים בפלטפורמה בגישה פתוחה, בדרך כלל לפני או במקביל לתהליך של בקרת עמיתים.  
תרשים של שלבי הפרסום של מאמר ניתן לראות בתמונה 1, הלקוחה מתוך הוובינר של רשת הספריות לרפואה בארצות הברית  (NNLM), שהתקיים לרגל תחילת הפיילוט. ההבדל העיקרי בין Preprint ל - Postprint הוא בקרת העמיתים שעבר ה -  Postprint,  כמו כן ל - Preprint ול - Postprint לא יהיה אותו מספר מזהה דיגיטלי DOI, בעוד ל -  Postprint ול - Published כן יהיה מספר DOI זהה שניתן על ידי המו"ל. 


תמונה 1. מקומו של  Preprint בשלבי הפרסום של מאמר מהסרטון


איך נזהה Preprint ב - PubMed?

על מנת להבטיח את שקיפות הפרסום, בכל רשומה של מאמר שהוא Preprint ב - PubMed תופיע הערה בצבע ירוק המדגישה שמדובר ב - Preprint שטרם עבר בקרת עמיתים (תמונה 2).


תמונה 2. תצוגה של Preprint ב - PubMed


בנוסף, ברשימת הפילטרים של PubMed  ניתן לראות כעת פילטר מיוחד בקטגוריה של Article Type עבור Preprint (תמונה 3). פילטר זה מאפשר חיפוש ממוקד של פרסומים אלה, וגם מאפשר להוריד פרסומים אלה מהחיפוש לפי הצורך באמצעות האופרטור NOT.

תמונה 3. פילטר עבור Preprint


מענין לראות איך יתקדם הפיילוט ומה יהיו מסקנותיו. על כך נשתמע בשנה הבאה!

יום ראשון, 21 ביוני 2020

Connected Papers - כלי ויזואלי חדש לאיתור מאמרים

מה אתם עושים כשאתם פוגשים חברים בסופי שבוע? אולי הולכים לים או יושבים לקפה? ובכן, יש חברים שנפגשים ומפתחים אתרים ופתרונות טכנולוגיים בזמן הזה. והפעם מדובר בחברים ישראלים - אלכס טרנבסקי איתן, אדי סמולנסקי ואיתי כנען הרפז -שחולקים במשך שנים את התסכול, אותו חשים רבים לעתים קרובות בעת ביצוע סקירת ספרות מדעית. וכך, כפרוייקט צדדי בפגישות בסופי שבוע נולד האתר.
הכלי שפיתחו השלושה נקרא Connected Papers , והוא מאפשר לאתר בקלות מאמרים דומים למאמר אחד שכבר יש לכם בתחום מסויים, ואת הקשרים ביניהם. הכלי הושק בראשית חודש יוני השנה, והוא קל ונוח לתפעול, וחופשי לשימוש (כרגע לא נתמך במובייל).

איך זה עובד?

העבודה עם Connected Papers מתחילה בהכנסת פרטי מאמר שברשותכם, שתרצו למצוא מאמרים הדומים לו. ניתן להכניס לכלי את מאמר המקור במגוון דרכים, כולל קישור מ - PubMed או Semantic Scholar, כותרת המאמר או מספר ה - DOI שלו (תמונה 1). 
לאחר זיהוי המאמר, הכלי סורק כ - 50 אלף מאמרים במאגר המידע Semantic Scholar, ומציג את הרלוונטיים ביותר מביניהם (כמה עשרות) בגרף. מכיון ש - Semantic Scholar הוא רב תחומי, הכלי מתאים למגוון תחומי מחקר.

העיקרון המוביל לקביעת הדמיון בין המאמרים הוא חפיפה מקסימלית בין המאמרים המופיעים ברשימות הביבליוגרפיות של שניהם. ככל שיש יותר דמיון בי הרשימות, כך סביר להניח שהמאמרים עוסקים באותו נושא. אין חובה שמאמרים יצטטו אחד את השני כדי לקבוע שהם דומים. ולפי הסבר שקיבלתי מיוצרי הכלי: הרעיון הוא שאם לשני מאמרים יש רשימות רפרנסים דומות אז הם כנראה באותו נושא (Bibliographic coupling). בנוסף, אם מאמרים אחרים מצטטים את שני המאמרים האלה ביחד אז הם גם כנראה באותו נושא (Co-citation).
ומחשבה שלי על הנושא: בדיקת הדמיון בין המאמרים באמצעות הרשימה הביבליוגרפית שלהם, ולא על פי הטקסט המלא שלהם, כמקובל במנועי חיפוש אחרים מבוססי בינה מלאכותית, מאפשרת בדיקה יסודית גם של מאמרים שאין גישה אל הטקסט המלא שלהם, היות והרשימות הביבליוגרפיות של מאמרים הן פתוחות לציבור בכל מקרה. 


תמונה 1. כל הדרכים להתחיל חיפוש ב - https://www.connectedpapers.com/

קריאת הגרף

מטרת הגרף המתקבל לאחר עיבוד המאמר שהוכנס לכלי היא להציג בצורה בולטת את המאמרים החשובים והרלוונטיים ביותר.  כל בועה בגרף מייצגת מאמר. ככל שהיא גדולה יותר, המאמר צוטט יותר פעמים, וככל שהיא כהה יותר המאמר חדש יותר. מאמרים דומים יופיעו בקבוצות (תמונה 2). 

מאמרים מקוריים ומאמרים נגזרים

אפשרות נוספת שקיימת בכלי היא קבלת מאמרים "מייסדים" (Prior works) ומאמרים "נגזרים" (Derivative works). מאמרים מייסדים (Ancestral papers) הם בד"כ מאמרים מקוריים, שהשפיעו ביותר על התחום ועל הדורות הבאים של המחקר. מאמרים נגזרים הם בד"כ סקירות שיטתיות, מטא-אנליזות או מאמרי State of the art המסכמים את הנעשה בתחום. 
אפשרות זו מקלה על זיהוי יסידות התחום הנבדק, ומעקב אחר התפתחותו לאורך השנים. 
המאמרים שמוגדרים כ - Prior/Derivative לא יופיעו בד"כ בגרף עצמו. בלחיצה על מאמר המופיע ברשימת ה- Prior/Derivative יסומנו בכחול כל המאמרים בגרף המצטטים אותו/מצוטטים על ידו, ולחיצה על מאמר המופיע בגרף תסמן בכחול את כל המאמרים ב - Prior/Derivative המצטטים אותו/מצוטטים על ידו (הסימון מופיע הן בתצוגת הרשימה והן בתצוגה הגרפית).

תמונה 2. גרף לדוגמה מ - Connected Papers

מידע נוסף

הספרן והבלוגר מסינגפור Aaron Tay  כתב לאחרונה פוסט מפורט בבלוג שלו על כלים נוספים המשתמשים במידע הביבליוגרפי לאיתור מאמרים, והספיק להכניס גם סקירה מפורטת על Connected Papers. שווה לקרוא את הסקירה ולהכיר כלים נוספים ואת היתרונות והחסרונות שלהם. 

לסיכום

מההתנסות שלי עד כה הכלי פשוט לשימוש, ומסייע למקד מאמרים בנושא מסויים בלי לטבוע בים של חומר. גם האופציה של קבלת מאמרי בסיס ומאמרים מסכמים שימושית. התוספת המתבקשת לכלי, שאחת ממטרותיו היא לסייע באיתור מאמרים לעבודות אקדמיות, היא אפשרות לייצא את המאמרים המתקבלים בחיפוש לתוכנה לניהול ציטוטים. בפניה למפתחי האתר נמסר לי כי הבקשה להוספת אפשרות זו עולה הרבה בקרב המשתמשים, והפרשנות שלי היא כי סביר להניח שאכן נראה אפשרות זו בהמשך. צריך לזכור שהכלי הושק רק החודש, כך שניתן לצפות לחידושים ושיפורים בעתיד. אשמח לשמוע אם התנסיתם בכלי ומה דעתכם?


יום רביעי, 10 ביוני 2020

ספרים רבותי ספרים

חודש יוני הוא חודש הספר, ועל אף שהשנה בוטלו ירידי הספרים עקב הקורונה, בספרים הדיגיטליים ניתן עדיין לצפות באופן חופשי. מנצלת את ההזדמנות לציין שני מקורות לספרים אקדמיים ברשת.

BookShelf - מדף הספרים של PubMed

BookShelf הוא מאגר הספרים בטקסט מלא של PubMed. המאגר הושק לראשונה בשנת 1999 (שלוש שנים לאחר שהושק PubMed עצמו) עם הטקסט המלא של המהדורה השלישית (שנת 1995) של הספר Molecular biology of the cell, המוכר היטב לכל מי שלמד תואר במדעי החיים. כעת ניתן לקרוא בו את מהדורה 4 משנת 2002. המהדורה האחרונה שהתפרסמה נכון להיום היא מהדורה 6 משנת 2015.  
BookShelf מכסה כיום מעל 7500 פרסומים במדעי החיים והרפואה, ומארח מעל 15 מליון מבקרים בחודש. כ - 300 פרסומים נוספים אליו מדי חודש.
למרות שמו, למעשה רק 1% מהפרסומים שמכסה המאגר הם ספרים (Textbooks). סוגי הפרסומים הנוספים במאגר הם בין היתר סקירות שיטתיות, דו"חות, הנחיות קליניות ומונוגרפים. על אף אחוז הספרים הנמוך מכלל החומר במאגר, הספרים הם אלה שזוכים לשימוש הגבוה ביותר.
ספרים מעניינים שאפשר לציין מהאוסף הם למשל הספר Hormones, Metabolism and the Benefits of Exercise או הספר Public Health Ethics: Cases Spanning the Globe

התוכן של BookShelf
תמונה 1. התוכן של BookShelf (מקור: סרטון זה)

מאגרי מידע בתוך BookShelf

תוכן האתר כולל גם מספר מאגרי מידע, בין היתר מאגרים שהועברו אליו מאתר Toxnet שהוסר מהרשת. שני מאגרים חשובים ושימושיים שאפשר לציין בהקשר זה הם מאגר LactMed, הכולל מידע רב על השפעת תרופות שונות על הנקה. הודעה על העברת המאגר ל- BookShelf אפשר לקרוא כאן, וכן מאגר Liver Tox הכולל מידע על תרופות, תוספי תזונה וחומרים נוספים העלולים לגרום לנזק לכבד. מאגרים אלה מתעדכנים באופן שוטף. מידע נוסף והדרכה לחיפוש במאגרים LactMed ו- Liver Tox ניתן לראות כאן בוובינר מיוני 2020 בנושא. 

איך מגיעים ב - BookShelf?

התוכן המכוסה על ידי BookShelf כלול ב - PubMed, כך שפריטים מתוכו יעלו בהתאם לחיפושים שתבצעו.  אם רוצים לחפש ישירות ב - BookShelf ניתן להגיע אליו דרך הקישורים שבתחתית דף הבית של  PubMed כמתואר בתמונה 2.


תמונה 2. גישה ישירה  ל - BookShelf מהקישורים בתחתית דף הבית של  PubMed


ניתן גם לסנן את תוצאות החיפוש ב -  PubMed לתוכן שמקורו ב -  BookShelf  על ידי שימוש בפילטרים המובנים של PubMed כמתואר בתמונה 3:

תמונה 3.סינון תוכן של חיפוש ב - PubMed למידע מ - BookShelf בלבד


לסינון מדוייק של ספרים או פרקים מספרים או ניתן להשתמש בחיפושים ללא תגית עם המונחים במתואר בתמונה 4:


תמונה 4. חיפושים ממוקדים לספרים ופרקים מספרים


מידע נוסף על אופן השימוש ב - BookShelf וכן רקע כללי על המאגר ניתן לראות כאן בסרטון
הרשמה לעדכונים על חומר חדש שעולה לאתר או עדכונים על חיפושים שנעשו ניתן לקבל באמצעות RSS מדף הבית של BookShelf או באמצעות Create Alert  ב - PubMed. 

Open Research Library


המטרה של Open Research Library, שהושקה רשמית בינואר השנה על פי הבלוג של ד"ר יפה אהרוני, היא להוות פלטפורמה שבה ירוכזו כל הספרים בגישה פתוחה שעברו בקרת עמיתים. בספריה נכון להיום מעל 20 אלף ספרים ופרסומים מדעיים נוספים, כולם בגישה פתוחה. ניתן לגלוש לפי קטגוריה או לפי המו"ל, ולשמור סימניות, הערות ומועדפים בחשבון אישי. שווה לגלוש קצת בין הקטגוריות או להשתמש באופציית החיפוש לאיתור הספר הרלוונטי לכם.