top of page

Cloudexify

230601
:מספר הפרויקט
שחר לוי, אורי ברורמן ומעיין משהדי
:שמות הסטודנטים המציגים
ד"ר כהן שראל
:שם המנחה
שיתופי פעולה במחקר
:שם הסדנה
מסלול טכנולוגי/מחקרי
:מסלול הסדנה
:GitHub
פוסטר
מצגת
:תקציר הפרויקט

בפרויקט זה אנו משתמשים בלמידת מכונה על מנת לייעל שאילתות לדאטאבייס. אנו מתמקדים בשאלת המחקר של שימוש בלמידת מכונה ליצירת אינדקס-משני (Secondary Index) לדאטא שאינו ממויין. אנו משתמשים בלמידת מכונה כדי ללמוד וקטורי פרמוטציה, שמאפשרים לבצע חיפוש בינארי על דאטא לא ממויין באמצעות גישה אקראית (Random Access). בנוסף אנו משתמשים בוקטורי חתימות (fingerprint vector) כדי לייעל חיפושים שמבצעים השוואות (equality lookups). אנו ממשים מאמר קיים (LSI: Learned Secondary Index) שפורסם בכנס VLDB, ולבסוף מראים גם שימוש של האלגוריתם - אנו מורידים דאטאסט חדש, מזינים אותו ל DynamoDB, למדנו כיצד הדאטא מיוצג בתוך DynamoDB וחילצנו את עמודת הנתונים המספריים, קידדנו את העמודה הזו בדרך הנדרשת לאלגוריתם LSI וביצענו Benchmarking על הדאטאסט החדש הזה שיצרנו עבור DynamoDB. כלומר, אנו מראים גם שימוש של האלגוריתם עבור דאטאבייס אמיתי (DynamoDB). המחקר בשיתוף פעולה עם ד"ר שראל כהן, מושיק הרשקוביץ (חוקר בכיר ב IBM Research), ירין פיניאן (יזם וארכיטקט תוכנה בתחום) ודניאל כהן (סטודנט תואר שני בהנחייתו של ד"ר שראל כהן).

bottom of page