דבש פיתחה את REXYGO שהוא מנוע חיפוש המיועד לחיפוש מידע (לא מסודר) המצוי על קבצים ומסמכים בארגון, מנוע זה הינו בעל תכונות ייחודיות רבות, הנדסת אנוש ברמה גבוהה מאוד, תוך הצגת יכולות מרשימות ביותר. מטרת מנוע החיפוש היא לסייע למחפש להגדיר את מבוקשו ולאתר עבורו את המידע הנחוץ לו מתוך מסמכי הארגון בהסתמך על המידע שסיפק.
השלמת הקלדה:
תוך כדי הקלדת השאלה מנסה מנוע החיפוש לנחש מהי המילה שאותה השואל מתחיל לכתוב תוך שהוא מתבסס על המילים הנפוצות ביותר במסמכי הארגון שמתחילות באותיות שכתב.
בצורה זו יכול השואל תוך כדי כתיבה להעריך האם המושג או המילה (מספר מוצר, שם מוצר, מספר קטלוגי וכו') כתובים נכון, לדעת בכמה מסמכים שונים ניתן למצוא אותם ולשפר את הדיוק בכתיבת השאלה ולקצר את זמנה.
חלופות:
באפשרות המחפש לקבל הצעות (מילים חילופיות) למילה שכתב. מנוע החיפוש משתמש בכמה שיטות שונות ומציע למשתמש רשימת מילים שיכולות לבוא במקום המילה שכתב:
• שגיאות כתיב: מילים הנשמעות כמו המילה אך בכתיב שגוי לדוגמא "מחשב" ו- "מכשב".
• מילים מוכלות / הטיות: מילים המכילות את המילה שכתב השואל או מוכלות בתוכה, לדוגמא: "מחשב" ו-"המחשב", "במחשב", "למחשב", "מחשבים" וכו'. וכן הטיות המילה ביחיד, רבים, עבר, הווה, עתיד ואותיות חיבור.
• שגיאות הקלדה: שגיאות הנובעות מהחסרת אות החלפת אות אחת באחרת.
• התחלות וסיומות: מילים שתחילת המילה זהה בהן למילה שהוקלדה.
התכנסות למטרה:
תכונה עיקרית, יכולתו של מנוע החיפוש להתאים את הקובץ או המסמך המתאים ביותר לטקסט המבוקש גם כאשר חלק מהמילים שבשאלה לא נמצאות במסמך התוצאה או אפילו לא מופיעות כלל בבסיס הנתונים.
בניגוד לשאר מנועי החיפוש בהם הוספת מילה אחת לשאלה או כתיבת אות מיותרת אחת עלולה לגרום לכך שהדף המבוקש לא יאותר, מנוע רקסי משפר את יכולת האיתור שלו ככל שמוסיפים מילים לשאלה.
אותה משמעות:
מנוע החיפוש מאתר דפים בהם קיימות מילים בעלות משמעות זהה למילים שנשאלו, גם אם הן כתובות בצורה שונה במעט.
לדוגמא: חיפוש המילה "מחשב" עשוי להביא גם דפים בהם מופיעים המילים "המחשב", "ומחשב", "מחשבים" וכו' בלי צורך לציין מילים אלה במפורש.
אינטליגנציה:
מנוע החיפוש מפעיל חשיבה מרובה כדי לאתר את המסמך המתאים ביותר לשאלה. הדבר מבוצע תוך התחשבות ושקלול פרמטרים רבים ובהם:
* נדירות : העדפת מילים נדירות ומתן חשיבות נמוכה למילים שכיחות (כאלה שנמצאות בדפים רבים).
* חשיבות : מתן משקל לחשיבות/מרכזיות המילה בתוכן הדף.
* מיקום : המנוע מייחס חשיבות למיקום המילה בתוך הקובץ (בכותרת, בטקסט, קרוב לתחילת המסמך וכו').
* קרבה : העדפת דפים בהם מילות החיפוש נמצאות במקבץ על פני דפים בהם מילות החיפוש נמצאות בפיזור.
* רצף : העדפה רבה לדפים בהם מילות השאלה מופיעות ברצף.
גודל השאלה:
אורך שאלה מקסימאלית – כ-300 מילים!
שפות:
החיפוש מבוצע באותה הרמה בכל שפה שהיא, אין חובה לבצע כל התאמה לשפה נוספת והוא מסוגל לחפש בכמה שפות שונות בעת ובעונה אחת. כל התכונות שהוזכרו למעלה מתקיימות בכל שפה.
הנדסת אנוש:
ממשק החיפוש מציג למשתמש מקטעים מתוך המסמכים המתאימים ביותר תוך הדגשת מילים מתוך השאלה כפי שהן מופיעות במקום המתאים ביותר בדף. מנוע החיפוש מאפשר למשתמש להיכנס לתוך הדף המבוקש תוך שהוא מקפיץ אותו ישירות לנקודה שבה נמצא הטקסט המבוקש בתוך המסמך.
אבטחה:
מנוע החיפוש סורק ומאתר עבור המשתמש רק מידע המצוי על המסמכים שהמחפש רשאי לראות.
הדבר מבוצע באמצעות התממשקות ל-Microsoft Active Directory והחלת מדיניות האבטחה והמידור בארגון.
קלות התקנה:
מנוע החיפוש מגיע כ-"קופסה סגורה", הוא מחובר לחשמל ולרשת המחשבים הארגונית. מנהל הרשת מגדיר באמצעות ממשק נוח וידידותי את התיקיות, המחשבים וסוגי הקבצים שהארגון מעוניין לבצע אליהם חיפושים ובזאת הסתיימה ההתקה.
קלות הטמעה:
מנוע החיפוש מותקן על גבי שרת יעודי ואינו מחייב התאמה כלשהי של מערכות הארגון לנוכחותו.
עומס:
הימצאותו של מנוע החיפוש בארגון אינה יוצרת כל עומס שהוא על הרשת, על רוחב הפס או על שרתים אחרים בארגון. תכונה זו נכונה גם בשלב ההקמה של מערכת האינדקסים עליהם מושתת מנוע החיפוש.
תהליך הטמעה אופייני:
* הגדרת השרת ברשת המקומית.
* הגדרת יעדי סריקה (תיקיות משותפות וכו').
* לחיצה על מקש "הפעל".
ביצועים:
בסיס נתונים : בן 5 מיליון קבצים ומסמכים.
מילים בדף : 300 בממוצע.
בשאלה : בת חמש מילים,
כמות התשובות : 100 הדפים המתאימים ביותר לשאלה.
זמן חיפוש : שנייה אחת.
סריקת החומר:
מנוע החיפוש סורק אזורים ברשת הארגונית (לפי החלטת מנהל הרשת) ומתעדכן בקצב מהיר ביותר מבלי להעמיס כלל על השרתים / התעבורה או המחשבים ברשת.
נכון להיום מנוע החיפוש יודע לקרוא ולאנדקס את כל החומר המצוי בתוך קבצי וורד (doc) אקסל (xls) אקרובט (pdf, html, xml) קבצי טקסט וקבצי קוד מקור במגוון רחב של מבנים. המנוע יודע גם להתמודד היטב עם השפה העברית בפורמטים שונים (עברית DOS ישנה, עברית Windows, Utf) ויודע לדאוג שהמסמכים יקראו ויוצגו נכון (ולא הפוך).
יכולת יוצאת דופן:
יכולתו של מנוע החיפוש, לאתר דפים המכילים חלק מהמילים שבשאלה מניבה תוצאה מפתיעה כאשר מכניסים לשורת השאלה שני משפטים שכל אחד מהם מגיע ממסמך אחר ואפילו בשפה אחרת.