קבצי PDF בתוצאות החיפוש של גוגל

גוגל החלה לראשונה לאנדקס קבצי PDF בשנת 2001 וכיום מאכסנת מאות מיליונים של דפי PDF מאונדקסים. הבלוג של Google Webmaster Tools אסף מספר שאלות נפוצות בנושא זה ועונה עליהן בהרחבה.

האם גוגל יכולה לאנדקס כל סוג של קובץ PDF?

 

באופן כללי גוגל יכולים לאנדקס תוכן טקסטואלי (בכל שפה שהיא) מקבצי PDF אשר מקודדים בתווים שונים, כל עוד הם לא מוצפנים באמצעות סיסמא. במקרים אשר בהם הטקסט מוטמע באמצעות תמונה, עדיין ניתן יהיה לעבד את התמונה באמצעות אלגוריתם שנקרא OCR על מנת לחלץ את הטקסט. כלל האצבע אומר שאם ניתן להעתיק ולהדביק את הטקסט מתוך קובץ ה-PDF אל מסמך טקסט סטנדרטי (לדוגמא מסמך וורד) אז גם גוגל יכולים לאנדקס את התוכן.

מה קורה עם תמונות בקבצי PDF?

נכון לכעת, לא ניתן לאנדקס תמונות בקבצי PDF. על מנת לאפשר לגוגל לאנדקס תמונות יש ליצור דפי HTML ייעודיים עבורם.

כיצד גוגל מתייחסת לקישורים בקבצי PDF?

באופן כללי קישורים בקבצי PDF מקבלים יחס זהה לקישורי HTML  רגילים: הם יכולים להעביר PageRank וכן סיגנאלים נוספים המצביעים על אינדוקס. עם זאת, נכון לכעת לא קיימת אפשרות לשים תג של nofollow  לקישורים בקבצי PDF.

כיצד ניתן למנוע מקבצי PDF להופיע בתוצאות החיפוש; או במידה והם כבר מופיעים, כיצד ניתן להסיר אותם?

הדרך הפשוטה ביותר למנוע מקבצי PDF להופיע בתוצאות החיפוש של גוגל היא להוסיף תג מטא של robots:noindex. הוא צריך להראות כך:

<meta name=”robots” content=”noindex”>

במידה והדף כבר מאונדקס, לאחר הוספת התגית הוא ייעלם עם הזמן. כמו כן, על מנת להסיר את הדף במהירות ניתן להיעזר בכלי הסרת הכתובות של Google Webmaster Tools.

קבצי PDF בתוצאות החיפוש של גוגל

האם קובץ PDF יכול להיות מדורג גבוה בתוצאות החיפוש?

כמובן שכן! דפי PDF לעיתים קרובות מדורגים גבוה ביחד עם דפי אינטרנט רגילים.

האם במקרה שבוא יש לי קובץ HTML וקובץ PDF עם אותו תוכן זה ייחשב כתוכן כפול?

בגוגל ממליצים ככל שניתן להימנע מתוכן כפול באמצעות הגשת עותק בודד יחיד ומאונדקס של התוכן. במידה והדבר לא ניתן, יש להצביע על הגרסא המועדפת ע”י הכללה של הדף המועדף במפת האתר או באמצעות תג הקנוניקל.

כיצד ניתן להשפיע על הטייטל המופיע בתוצאות החיפוש של גוגל עבור קובץ ה-PDF?

גוגל משתמשת בשני אלמנטים על מנת לקבוע את ה-title של קובץ ה-PDF: הטייטל המופיע ב-meta בקובץ ה-PDF, וכן טקסט העוגן של הקישורים המצביעים אל אותו קובץ PDF (בדומה לקובץ HTML רגיל). בגוגל ממליצים להשתמש בשני הסיגנלים על מנת לסייע לה לבחור בטייטל המתאים ביותר עבור אותו קובץ.

בונוס: האם ניתן לבצע הפניות 301 עבור קבצי PDF?

מצאתי לנכון לענות על שאלה זאת, אשר לא הופיעה בפוסט המקורי אבל היא חשובה מאד.התשובה היא פשוטה-כן, ניתן לבצע הפניות 301 עבור קבצי PDF באמצעות HTACESS. הסינטקס זהה לחלוטין להפניית 301 עבור דפי  HTML רגילים:

Redirect 301 /seo.pdf  http://www.example.com/seo.html

 

  • טופס יצירת קשר

    054-8647829

       

    • היתרונות שלנו

      • התחייבות לתוצאות מוכחות
      • מעל 10 שנים ניסיון בתחום
      • ליווי אישי כל הדרך למעלה.
      • מומחים אקדמאיים מנוסים.
      • דיווח חודשי מקיף ומפורט
      • בסיס נרחב של לקוחות מרוצים
      • השיטות המתקדמות בעולם
    • קבצי PDF בתוצאות החיפוש של גוגל - קידום אתרים באינטרנט


      Call Now Buttonלקידום האתר שלך