رجکس (Regex) یا عبارات باقاعده، اغلب به عنوان ابزاری پیچیده و مختص برنامهنویسان شناخته میشود. اما واقعیت این است که برای متخصصان سئو و تحلیلگران داده، رجکس یک مهارت حیاتی برای فیلتر کردن و دستهبندی دقیق اطلاعات است. ابزارهایی مانند سرچ کنسول، گوگل آنالیتیکس یا اسکریمینگ فراگ، بدون درک الگوهای عملی رجکس برای تحلیل صفحات (Pages)، کارایی کامل خود را نشان نمیدهند. این مقاله به شکل مستقیم و کاربردی، الگوهای مورد نیاز شما را بدون پیچیدگیهای غیرضروری آموزش میدهد تا بتوانید دادههای خود را به شکلی مؤثرتر بخشبندی و تحلیل کنید.
جدول کاربردی: الگوهای پرکاربرد رجکس برای تحلیل سئو
این جدول میتواند بلافاصله پس از مقدمه قرار گیرد تا ارزش محتوای شما را به کاربر نشان دهد.
| الگو (Pattern) | توضیح کاربرد | مثال عملی در تحلیل صفحات |
| ^ (Caret) | شروع خط: اطمینان حاصل میکند که عبارت مورد نظر دقیقاً در ابتدای URL یا متن قرار دارد. | ^/blog/
(تمام صفحاتی که URL آنها با /blog/ شروع میشود را پیدا میکند.) |
| $ (Dollar) | پایان خط: اطمینان حاصل میکند که عبارت مورد نظر دقیقاً در انتهای URL یا متن قرار دارد. | \.pdf$
(تمام URLهایی که به .pdf ختم میشوند را پیدا میکند.) |
| **` | `** (Pipe) | عملگر یا (OR): به شما اجازه میدهد چند کلمه یا عبارت مختلف را همزمان جستجو کنید. |
| .* (Dot-Star) | هر چیزی (Wildcard): رایجترین الگو؛ به معنای “هر کاراکتری (.) که هر تعداد بار (*) تکرار شود”. | /product/.*-red/
(محصولاتی که کلمه red را در جایی پس از /product/ دارند، پیدا میکند.) |
| (…) (Parentheses) | گروهبندی: برای ترکیب چند الگو یا استفاده از عملگر ` | ` در داخل یک گروه استفاده میشود. |
| \ (Backslash) | نادیده گرفتن (Escape): زمانی که میخواهید از یک کاراکتر خاص رجکس (مثل .) به عنوان کاراکتر عادی استفاده کنید. | /page\.html
(دقیقاً page.html را پیدا میکند، نه page[any character]html.) |
فیلتر کردن بر اساس پسوند چیست و چرا یک تکنیک حیاتی است؟
در دنیای امروز که با حجم عظیمی از محتوای آنلاین روبرو هستیم، پیدا کردن اطلاعات دقیق، اغلب چالشبرانگیز است. بیشتر محتوای وب به شکل صفحات HTML (سایتها، وبلاگها و فروشگاهها) ارائه میشود. اما مواقعی وجود دارد که شما به دنبال خودِ صفحه وب نیستید، بلکه به دنبال سند یا فایل دادهای هستید که آن صفحه به آن لینک داده است.
فیلتر کردن بر اساس پسوند (Filtering by File Extension) یک روش جستجوی پیشرفته و دقیق است که به شما اجازه میدهد نتایج جستجوی خود را فقط به فرمتهای خاصی از فایلها محدود کنید.
این تکنیک «حیاتی» تلقی میشود، زیرا به شما امکان میدهد تا موتور جستجو را وادار کنید هزاران صفحه وبلاگ، مقاله تبلیغاتی و نتایج غیرمرتبط را نادیده بگیرد و مستقیماً فایلهای قابل دانلودی را که برای تحقیق، تحلیل یا مطالعه نیاز دارید، به شما نشان دهد. این کار، فرآیند تحقیق و گردآوری داده را از ساعتها به دقایقی کوتاه کاهش میدهد و یک نمونه واضح از ارائه ارزش افزوده قابل توجه نسبت به نتایج جستجوی عادی است.
درک مفهوم «پسوند فایل» (File Extension)
پسوند فایل، یک شناسه کوتاه (معمولاً شامل سه یا چهار حرف) است که پس از آخرین نقطه در نام یک فایل قرار میگیرد. این شناسه به سیستمعامل، نرمافزارها و همچنین موتورهای جستجو اطلاع میدهد که ماهیت و نوع فایل چیست و باید با چه برنامهای باز شود.
به بیان ساده، اگر نام فایل «اسم» آن باشد، پسوند «فامیل» آن است و هویت آن را مشخص میکند. درک این پسوندها اولین قدم برای استفاده مؤثر از فیلتر جستجو است.
چند نمونه از پسوندهای رایج عبارتند از:
- .pdf: (Portable Document Format) اسناد متنی ثابت، مناسب برای مقالات، کتابها و گزارشها.
- .docx: سند متنی قابل ویرایش (Microsoft Word).
- .xlsx: صفحه گسترده و فایل داده (Microsoft Excel).
- .pptx: فایل ارائه (Microsoft PowerPoint).
- .jpg / .png: فایلهای تصویری.
- .csv: (Comma-Separated Values) دادههای خام جدولی که برای استفاده در دیتابیسها و نرمافزارهای تحلیلی کاربرد دارد.
کاربرد فیلتر پسوند برای دانشجویان (پیدا کردن مقالات PDF)
این یکی از مشخصترین و مفیدترین کاربردها برای مخاطبان دانشجو و پژوهشگر است. فرض کنید به دنبال یک مقاله علمی یا کتاب در مورد «هوش مصنوعی در پزشکی» هستید. جستجوی عادی هزاران پست وبلاگی و خبری را برمیگرداند.
اما دانشجویان و محققان معمولاً به دنبال منابع آکادمیک و قابل استناد، یعنی فایلهای PDF هستند.
روش کار:
شما میتوانید با استفاده از عملگر جستجوی filetype: در گوگل (یا موتورهای جستجوی دیگر)، جستجوی خود را به این شکل محدود کنید:
مثال: هوش مصنوعی در پزشکی filetype:pdf
این دستور، تمام صفحات وبلاگی و HTML را حذف میکند و فقط نتایجی را نشان میدهد که مستقیماً به یک فایل PDF ختم میشوند. این کار به دانشجو کمک میکند تا بدون اتلاف وقت، به منابع اصلی دسترسی پیدا کند.
کاربرد برای بازاریابان و تحلیلگران (دسترسی به گزارشها و دادهها)
این تکنیک به همان اندازه برای متخصصان کسبوکار، بهویژه در حوزه بازاریابی و تحلیل داده، ارزشمند است. این افراد اغلب به دنبال اطلاعاتی فراتر از مقالات سطحی هستند.
- بازاریابان: اغلب به دنبال گزارشهای صنعتی، ارائههای کنفرانسها یا مطالعات موردی هستند. این موارد معمولاً به صورت فایلهای .pptx (پاورپوینت) یا .pdf منتشر میشوند.
- مثال: گزارش ترندهای بازاریابی ۲۰۲۵ filetype:pptx
- تحلیلگران داده: ممکن است به دنبال مجموعه دادههای خام (Datasets) برای تمرین یا تحلیل بازار باشند. این دادهها اغلب با فرمت .xlsx (اکسل) یا .csv (فایلهای متنی جدا شده با کاما) در وب منتشر میشوند.
- مثال: آمار فروش خردهفروشی ایران filetype:xlsx
این نوع جستجو، اطلاعاتی را در اختیار شما قرار میدهد که در حالت عادی به سختی پیدا میشوند و ارزش افزودهای بسیار بالاتر از نتایج جستجوی معمولی دارند.
چگونه این روش در زمان شما صرفهجویی میکند؟
پاسخ در یک کلمه خلاصه میشود: دقت.
به جای اینکه شما به عنوان کاربر، مجبور باشید در میان دهها صفحه نامرتبط جستجو کنید تا شاید در انتهای یک صفحه، به لینک دانلود یک فایل برسید، شما از ابتدا به موتور جستجو دستور میدهید که فقط نتایج نهایی و قابل دانلود را به شما نمایش دهد.
این کار به طور مستقیم:
- نویز را حذف میکند: شما دیگر با مقالات تبلیغاتی، کمعمق یا صرفاً خلاصهکننده مطالب دیگران مواجه نمیشوید.
- سرعت تحقیق را بالا میبرد: دسترسی مستقیم به اسناد، به شما امکان میدهد به جای «پیدا کردن»، بر «تحلیل کردن» محتوا تمرکز کنید.
- دسترسی به اطلاعات پنهان را ممکن میسازد: بسیاری از گزارشها و دادههای ارزشمند در اعماق وبسایتها قرار دارند و در جستجوی عادی به راحتی پیدا نمیشوند، اما فیلتر پسوند آنها را مستقیماً استخراج میکند.
فیلتر کردن بر اساس پسوند فایل، یک ترفند ساده نیست، بلکه یک مهارت اساسی برای هر کسی است که به صورت حرفهای با وب کار میکند. این روش به شما کمک میکند تا کنترل جستجو را به دست بگیرید، در زمان صرفهجویی کنید و به اطلاعاتی دست یابید که دیگران به سادگی از آن عبور میکنند. تسلط بر این تکنیک، کیفیت خروجی کار شما را به شکل محسوسی افزایش میدهد و محتوایی است که ارزش به اشتراکگذاری و ارجاع را دارد.
روش اصلی: استفاده از اپراتور filetype: در گوگل
سادهترین و دقیقترین روش برای فیلتر کردن نتایج جستجو، استفاده از یک دستور یا «اپراتور» (Operator) داخلی خود گوگل است. این اپراتور به موتور جستجو دستور میدهد که به جای صفحات وب استاندارد (HTML)، فقط فایلهایی با فرمت مشخص شده را در نتایج نمایش دهد. این روش، کنترل جستجو را مستقیماً در اختیار شما قرار میدهد.
معرفی اپراتور جستجوی filetype:
اپراتور filetype: (خوانده میشود: فایلتایپ) یک دستور کوتاه و مستقیم است که در نوار جستجوی گوگل تایپ میشود. این دستور مانند یک فیلتر بسیار قوی عمل میکند و به گوگل میگوید: «صرفاً نتایجی را به من نشان بده که پسوند آنها دقیقاً با چیزی که مشخص کردهام، مطابقت دارد.»
نکته مهم در استفاده از این اپراتور، سادگی و دقت آن است. نباید هیچ فاصلهای بین filetype: و پسوند مورد نظر وجود داشته باشد (مثلاً filetype:pdf درست است، اما filetype: pdf نتیجه درستی نخواهد داد).
فرمول دقیق جستجو: [کلیدواژه] + filetype:pdf
ساختار استفاده از این دستور، مستقیم و بدون پیچیدگی است. شما ابتدا عبارت کلیدی (Keyword) خود را مینویسید، یک فاصله (Space) ایجاد میکنید و سپس اپراتور filetype: را همراه با پسوند مورد نظر (بدون فاصله) اضافه میکنید.
ساختار فرمول:
[عبارت جستجوی شما] [filetype:پسوند]
مثال:
آموزش سئو filetype:pdf
این جستجو به گوگل میگوید که فقط فایلهای PDF مرتبط با «آموزش سئو» را پیدا کند و تمام صفحات وبلاگ و سایتهای دیگر را نادیده بگیرد.
مثالهای عملی برای پسوندهای رایج:
در ادامه، نحوه استفاده از این اپراتور برای چند مورد از پرکاربردترین پسوندهای فایل بررسی شده است.
جستجوی فایلهای PDF (مثال: “تحلیل تکنیکال filetype:pdf“)
این رایجترین کاربرد است. PDF (Portable Document Format) فرمت استاندارد برای کتابهای الکترونیکی، مقالات دانشگاهی، گزارشهای رسمی و راهنماهای فنی است.
- کاربرد: تحلیل تکنیکال filetype:pdf
- نتیجه: دسترسی مستقیم به مقالات، کتابها و جزوات مرتبط با تحلیل تکنیکال.
پیدا کردن فایلهای پاورپوینت (filetype:pptx یا filetype:ppt)
فایلهای پاورپوینت (PPT) اغلب شامل خلاصههای مدیریتی، ارائههای کنفرانسها و گزارشهای آماری تصویری هستند. جستجوی این فایلها میتواند دیدگاههای خوبی از سمینارها یا گزارشهای داخلی شرکتها ارائه دهد.
- کاربرد: گزارش بازاریابی دیجیتال filetype:pptx
- نکته: اگر نتایج کافی نبود، میتوانید از پسوند قدیمیتر ppt نیز برای پوشش فایلهای قدیمیتر استفاده کنید.
یافتن اسناد ورد (filetype:docx یا filetype:doc)
اسناد ورد (Word) معمولاً برای فرمهای خام، الگوها (Templates)، پیشنویسهای قرارداد یا گزارشهای متنی که برای ویرایش باز هستند، استفاده میشوند.
- کاربرد: نمونه قرارداد استخدام filetype:docx
- نکته: در اینجا هم استفاده از پسوند قدیمی doc میتواند نتایج بیشتری را شامل شود.
استخراج داده با فایلهای اکسل (filetype:xlsx یا filetype:xls)
این یکی از قدرتمندترین کاربردها برای تحلیلگران و بازاریابان است. فایلهای اکسل (Excel) اغلب حاوی دادههای خام، لیستهای قیمت، مدلهای مالی یا آمارهای دستهبندی شده هستند که مستقیماً قابل استفاده و تحلیلاند.
- کاربرد: لیست قیمت محصولات filetype:xlsx
- نتیجه: یافتن فایلهای اکسل حاوی لیست قیمتها یا دادههای آماری مرتبط با محصولات.
جستجوی پیشرفته: ترکیب filetype: با سایر اپراتورها (تکنیکهای حرفهای)
استفاده از filetype: به تنهایی مفید است، اما قدرت واقعی این اپراتور زمانی مشخص میشود که آن را با سایر دستورهای جستجوی پیشرفته گوگل ترکیب کنید. این کار به شما امکان میدهد تا نتایج را به شکلی بسیار دقیق فیلتر کرده و مستقیماً به همان فایلی برسید که در یک وبسایت خاص یا با یک عنوان مشخص به دنبال آن هستید.
محدود کردن جستجو به یک سایت خاص (ترکیب site: و filetype🙂
این یکی از پرکاربردترین و مؤثرترین ترکیبات است. اپراتور site: جستجوی شما را فقط به یک دامنه (وبسایت) محدود میکند.
وقتی شما filetype: و site: را همزمان استفاده میکنید، در واقع به گوگل میگویید: «فقط در داخل این وبسایت مشخص، به دنبال فایلهایی با این پسوند خاص بگرد.»
این تکنیک برای یافتن گزارشهای رسمی، اسناد داخلی، راهنماها یا هر فایل دیگری که میدانید توسط یک سازمان یا شرکت خاص منتشر شده، ایدهآل است.
مثال: “گزارش سالانه filetype:pdf site:cbi.ir“
این یک مثال عملی و عالی است. بیایید آن را تحلیل کنیم:
- site:cbi.ir: جستجو را به وبسایت بانک مرکزی ایران محدود میکند.
- filetype:pdf: نتایج را فقط به فایلهای PDF محدود میکند.
- “گزارش سالانه”: (استفاده از کوتیشن “” برای جستجوی دقیق عبارت) به دنبال این عبارت کلیدی میگردد.
نتیجه: به جای مواجه شدن با صدها مقاله خبری یا تحلیلی در سایتهای مختلف درباره گزارش سالانه بانک مرکزی، این جستجو مستقیماً فایل PDF خود گزارش را که روی سرور بانک مرکزی قرار دارد، به شما نمایش میدهد. این اوج دقت در جستجو است.
پیدا کردن فایلهایی با کلمه کلیدی در عنوان (ترکیب intitle🙂
اپراتور intitle: نتایج را به مواردی محدود میکند که کلمه کلیدی شما در عنوان (Title) فایل یا صفحه وجود داشته باشد. این یک سیگنال بسیار قوی برای مرتبط بودن است.
ترکیب آن با filetype: بسیار هوشمندانه است. شما به دنبال فایلی هستید که نه تنها حاوی کلمه کلیدی شما باشد، بلکه عنوان آن فایل نیز مستقیماً به آن موضوع اشاره داشته باشد.
مثال: intitle:”طرح توجیهی” filetype:pdf
این دستور، فایلهای PDF را پیدا میکند که عبارت «طرح توجیهی» دقیقاً در عنوان آنها ذکر شده باشد.
جستجوی فایل در آدرسهای مشخص (ترکیب inurl🙂
اپراتور inurl: کلمه کلیدی شما را در آدرس صفحه (URL) جستجو میکند. این تکنیک زمانی مفید است که ساختار وبسایتها قابل پیشبینی باشد.
بسیاری از سایتها فایلهای خود را در پوشههایی با نامهای مشخص مانند uploads، downloads یا reports قرار میدهند.
مثال: inurl:report filetype:xlsx
این جستجو به دنبال فایلهای اکسلی میگردد که کلمه «report» (گزارش) در آدرس URL آنها وجود داشته باشد. این روش اغلب فایلهایی را پیدا میکند که شاید به راحتی از طریق منوهای سایت قابل دسترسی نباشند.
استفاده از عملگر OR برای جستجوی چند پسوند (تجربه عملی)
گاهی اوقات شما نمیدانید فایل مورد نظر با پسوند قدیمی (مانند doc) ذخیره شده یا پسوند جدید (docx). یا شاید بخواهید همزمان به دنبال فایلهای اکسل و CSV بگردید. در اینجا اپراتور OR (باید با حروف بزرگ نوشته شود) یا معادل آن، کاراکتر | (پایپ)، به کار میآید.
برای تمیزتر بودن و اطمینان از اجرای صحیح، بهتر است پسوندها را داخل پرانتز گروهبندی کنید.
مثال (جستجوی اسناد ورد، جدید و قدیم):
“آیین نامه انضباطی” (filetype:doc | filetype:docx)
مثال (جستجوی دادههای آماری):
“آمار جمعیتی” (filetype:xlsx | filetype:csv)
این روش، محدوده جستجوی شما را گسترش میدهد تا اطمینان حاصل کنید که فرمتهای مختلف یک نوع فایل را از دست نمیدهید.
آیا فیلتر پسوند در موتورهای جستجوی دیگر کار میکند؟
بله، اپراتور filetype: یک دستور جستجوی پیشرفتهی شناختهشده است و تنها به گوگل محدود نمیشود. سایر موتورهای جستجوی اصلی نیز از این دستور یا معادلهای آن برای فیلتر کردن نتایج بر اساس نوع فایل پشتیبانی میکنند. این قابلیت، یک ابزار استاندارد برای جستجوی دقیق محسوب میشود.
بررسی عملکرد اپراتور filetype: در بینگ (Bing)
موتور جستجوی بینگ (Bing)، متعلق به مایکروسافت، از اپراتور filetype: دقیقاً به همان شکلی که در گوگل استفاده میشود، پشتیبانی میکند.
شما میتوانید به سادگی عبارت کلیدی خود را به همراه این دستور در بینگ جستجو کنید و نتایج محدود به همان پسوند فایل خواهد شد.
مثال در بینگ: استراتژی محتوا filetype:pdf
این دستور در بینگ نیز به خوبی کار میکند و فایلهای PDF مرتبط با استراتژی محتوا را برمیگرداند.
روش جستجو بر اساس نوع فایل در DuckDuckGo
موتور جستجوی DuckDuckGo که بر حفظ حریم خصوصی کاربران تمرکز دارد، از نظر قابلیتهای جستجوی پیشرفته بسیار قوی است. این موتور جستجو نیز به طور کامل از اپراتور filetype: پشتیبانی میکند.
روش استفاده کاملاً مشابه گوگل و بینگ است.
مثال در DuckDuckGo: راهنمای سئو filetype:pptx
DuckDuckGo این دستور را شناسایی کرده و نتایج را به فایلهای پاورپوینت محدود خواهد کرد. این نشان میدهد که filetype: یک استاندارد پذیرفتهشده در میان موتورهای جستجوی مختلف است.
چرا نتایج در موتورهای جستجوی مختلف، متفاوت است؟
این یک سوال بسیار مهم است. اگر شما دقیقاً یک عبارت جستجو (مانند “گزارش” filetype:pdf) را در گوگل، بینگ و DuckDuckGo وارد کنید، لیست نتایج یکسانی دریافت نخواهید کرد.
این تفاوت، به اپراتور filetype: مربوط نیست، بلکه به سه تفاوت اساسی در هسته موتورهای جستجو برمیگردد:
- ایندکس متفاوت (Different Index): هر موتور جستجو، خزنده (Crawler) و پایگاه داده (Index) مخصوص به خود را دارد. گوگل ممکن است فایل PDF خاصی را روی یک سایت کشف و ایندکس کرده باشد، در حالی که بینگ هنوز آن را پیدا نکرده باشد (یا برعکس). حجم ایندکس گوگل معمولاً بزرگتر است.
- الگوریتم رتبهبندی متفاوت (Different Algorithm): حتی اگر هر دو موتور جستجو، ۱۰ فایل PDF یکسان را پیدا کنند، «ترتیب» نمایش آنها متفاوت خواهد بود. گوگل بر اساس معیارهای خود (مانند E-E-A-T، اعتبار دامنه و…) تصمیم میگیرد که کدام فایل مفیدتر است، در حالی که بینگ الگوریتم رتبهبندی خاص خود را دارد.
- منبع دادهها: DuckDuckGo نتایج خود را از منابع مختلفی، از جمله ایندکس خود و همچنین APIهای موتورهای دیگر (مانند بینگ) تأمین میکند. بنابراین، نتایج آن ترکیبی خواهد بود.
اپراتور filetype: در تمام موتورهای جستجوی اصلی کار میکند، اما نتایجی که دریافت میکنید، به دلیل تفاوت در ایندکس و الگوریتمهای رتبهبندی هر پلتفرم، متفاوت خواهد بود.
فراتر از موتورهای جستجو: فیلتر بر اساس پسوند در سیستمعامل
توانایی فیلتر کردن فایلها بر اساس پسوند، تنها به جستجوی آنلاین محدود نمیشود. این یک ابزار بنیادی و بسیار کاربردی برای مدیریت فایلها در کامپیوتر شخصی شماست. سیستمعاملها، چه ویندوز و چه macOS، ابزارهای قدرتمندی برای جستجوی دقیق فایلها بر اساس نوع (Kind) یا پسوند (Extension) در اختیار شما قرار میدهند.
استفاده از این قابلیت به شما کمک میکند تا در میان صدها یا هزاران فایل موجود در هارد دیسک خود، دقیقاً همان سند، عکس یا فایل دادهای را که نیاز دارید، در چند ثانیه پیدا کنید.
نحوه پیدا کردن فایلها بر اساس پسوند در جستجوی ویندوز (File Explorer)
در سیستمعامل ویندوز، این کار به سادگی از طریق نوار جستجو در File Explorer انجام میشود.
- باز کردن File Explorer: پنجره File Explorer را باز کنید (با فشردن کلیدهای Windows + E).
- انتخاب محل جستجو: به درایو یا پوشهای که میخواهید در آن جستجو کنید بروید (مثلاً This PC تا در تمام کامپیوتر بگردد، یا پوشه Documents).
- استفاده از نوار جستجو: در نوار جستجو (معمولاً در گوشه بالا سمت راست)، میتوانید به دو روش عمل کنید:
- روش مستقیم (Wildcard): از نماد ستاره * به عنوان «هر نامی» استفاده کنید.
مثال: *.pdf (این دستور یعنی: «همه فایلهایی که نامشان هر چیزی است، اما پسوندشان .pdf است را پیدا کن.»)
-
- روش با اپراتور ext: ویندوز اپراتور مشخصی به نام ext: (مخفف Extension) دارد که دقیقاً همین کار را انجام میدهد.
مثال: ext:.pdf
هر دو روش نتایج یکسانی برمیگردانند. شما همچنین میتوانید این جستجو را با کلمات کلیدی ترکیب کنید:
مثال ترکیبی: گزارش ext:.xlsx
(این دستور به دنبال تمام فایلهای اکسل میگردد که کلمه «گزارش» در نام یا محتوای آنها وجود داشته باشد.)
آموزش جستجوی پیشرفته بر اساس نوع فایل در macOS (Finder)
سیستمعامل macOS نیز از طریق برنامه Finder، قابلیتهای جستجوی بسیار دقیقی ارائه میدهد.
- باز کردن Finder: برنامه Finder را باز کنید.
- شروع جستجو: در نوار جستجوی بالا سمت راست، کلیک کنید (یا کلیدهای Command + F را بزنید).
- تعیین محدوده: ابتدا مشخص کنید که جستجو در «This Mac» (کل مک) یا فقط در پوشه فعلی انجام شود.
- افزودن فیلتر:
- پس از تایپ عبارت، یا حتی بدون تایپ، روی دکمه مثبت (+) در زیر نوار جستجو کلیک کنید تا یک ردیف فیلتر جدید اضافه شود.
- در منوی کشویی اول (که معمولاً روی Kind یا Name است)، گزینه Kind (نوع) را انتخاب کنید.
- در منوی کشویی دوم، نوع فایل مورد نظر خود را انتخاب کنید (مثلاً PDF Document، Image، Spreadsheet).
روش دقیقتر (بر اساس خود پسوند):
اگر نوع فایل مورد نظر شما در لیست Kind نبود، میتوانید مستقیماً بر اساس «پسوند» جستجو کنید:
- در همان منوی کشویی اول (Kind)، روی آن کلیک کرده و گزینه Other… را انتخاب کنید.
- در پنجره باز شده، عبارت File Extension (پسوند فایل) را جستجو و انتخاب کنید و آن را به لیست خود اضافه کنید.
- اکنون میتوانید فیلتر را به این صورت تنظیم کنید: File Extension | is | pdf
این روش به شما کنترل کاملی برای یافتن دقیق هر نوع فایلی بر اساس پسوند آن در macOS میدهد.
(برای توسعهدهندگان) پیادهسازی فیلتر پسوند در جستجGوی داخلی سایت
بهبود جستجوی داخلی (Internal Site Search) یکی از مؤلفههای کلیدی در بهینهسازی نرخ تبدیل (CRO) و افزایش رضایت کاربر (UX) است. زمانی که یک وبسایت، بهخصوص سایتهای آموزشی، شرکتی یا سازمانی، حاوی تعداد زیادی فایل دانلودی (مانند PDF، گزارشهای اکسل یا ارائههای پاورپوینت) باشد، جستجوی پیشفرض وردپرس یا دیگر CMSها کارایی لازم را ندارد.
پیادهسازی فیلتر بر اساس پسوند، به کاربر اجازه میدهد تا نویز اطلاعاتی (صفحات وبلاگ و محصولات) را حذف کرده و مستقیماً به «منابع» (Resources) مورد نظر خود دسترسی پیدا کند.
ملاحظات فنی برای جستجوی داخلی (Custom Search)
قبل از پیادهسازی، چه به صورت سفارشی و چه با افزونه، باید چند جنبه فنی کلیدی را در نظر گرفت:
- ایندکس کردن فایلها: جستجو نمیتواند چیزی را پیدا کند که از وجود آن بیخبر است. سیستم جستجوی شما باید نه تنها پستها و صفحات، بلکه تمام فایلهای آپلود شده در کتابخانه رسانه (Media Library) را نیز ایندکس کند.
- ذخیره MIME Type: تکیه بر پسوند فایل (مثل .pdf) خوب است، اما روش استاندارد و فنیتر، ذخیره و فیلتر بر اساس MIME Type (مانند application/pdf) است. وردپرس این اطلاعات را هنگام آپلود فایل در دیتابیس (جدول wp_posts با post_type=’attachment’) ذخیره میکند.
- منطق Backend: هسته جستجوی شما باید اصلاح شود. هنگام ارسال فرم جستجو، یک پارامتر اضافی (مثلاً ?file_type=pdf) باید به کوئری اضافه شود. سپس Backend (مثلاً PHP) باید این پارامتر را دریافت کرده و کوئری اصلی دیتابیس را تغییر دهد تا post_type را به attachment و post_mime_type را به مقدار مربوطه محدود کند.
- طراحی رابط کاربری (UI/UX): باید تصمیم بگیرید کاربر چگونه این فیلتر را اعمال کند. آیا یک دراپداون (Dropdown) کنار نوار جستجو باشد؟ یا به صورت چکباکس در صفحه نتایج جستجو (مانند فیلترهای دیجیکالا) اعمال شود؟ راهحل دوم (معروف به Faceted Search) تجربه کاربری بهتری ارائه میدهد.
روش پیادهسازی در وردپرس (استفاده از افزونه یا کد سفارشی)
در اکوسیستم وردپرس، دو مسیر اصلی برای افزودن این قابلیت وجود دارد:
۱. استفاده از افزونههای تخصصی (مسیر پیشنهادی):
این افزونهها تمام ملاحظات فنی بالا (مانند ایندکس کردن و رابط کاربری) را به صورت بهینه مدیریت میکنند:
- SearchWP: این یکی از بهترین افزونهها برای بازطراحی کامل جستجوی وردپرس است. SearchWP به شما اجازه میدهد تا کتابخانه رسانه و حتی محتوای داخل فایلهای PDF را ایندکس کنید. سپس میتوانید در نتایج جستجو، فایلها را بر اساس نوع آنها فیلتر کنید.
- FacetWP: اگر به دنبال ایجاد یک سیستم فیلتر پیشرفته در صفحه نتایج (Faceted Search) هستید، FacetWP بهترین گزینه است. این افزونه به شما اجازه میدهد فیلترهایی بر اساس post_type (که میتوانید آن را به attachment محدود کنید) و MIME Type بسازید تا کاربر بتواند نتایج را به صورت زنده فیلتر کند.
۲. استفاده از کد سفARشی (مسیر سبک و فنی):
اگر نمیخواهید از افزونههای سنگین استفاده کنید، میتوانید با استفاده از هوک (Hook) اصلی وردپرس، یعنی pre_get_posts، عملکرد جستجوی پیشفرض را تغییر دهید.
مفهوم کد (مثال سادهسازی شده برای فایل functions.php):
شما میتوانید یک فرم جستجوی سفارشی با یک دراپداون (مثلاً با name=’file_type’) ایجاد کنید. سپس با کد زیر، کوئری اصلی را مشروط به انتخاب کاربر تغییر دهید:
PHP
function custom_search_filter_by_filetype($query) {
// فقط در کوئری اصلی، در صفحه جستجو و نه در ادمین اجرا شود
if ( $query->is_main_query() && $query->is_search() && !is_admin() ) {
// بررسی اینکه آیا فیلتر ما از فرم ارسال شده است
if ( isset($_GET[‘file_type’]) && !empty($_GET[‘file_type’]) ) {
$mime_type = ”;
// تبدیل انتخاب کاربر به MIME Type استاندارد
switch ($_GET[‘file_type’]) {
case ‘pdf’:
$mime_type = ‘application/pdf’;
break;
case ‘xlsx’:
$mime_type = ‘application/vnd.openxmlformats-officedocument.spreadsheetml.sheet’;
break;
// … سایر موارد
}
if (!empty($mime_type)) {
// اعمال فیلترها به کوئری اصلی وردپرس
$query->set(‘post_type’, ‘attachment’); // فقط در رسانهها بگرد
$query->set(‘post_mime_type’, $mime_type); // فقط این نوع فایل
$query->set(‘post_status’, ‘inherit’); // فایلهای پیوست شده معمولاً این وضعیت را دارند
}
}
}
}
add_action(‘pre_get_posts’, ‘custom_search_filter_by_filetype’);
توجه: این کد یک نمونه مفهومی است. پیادهسازی کامل نیازمند اصلاح فرم جستجو (searchform.php) و اطمینان از هماهنگی آن با منطق pre_get_posts است.
اشتباهات رایج و عیبیابی (چرا فیلتر کردن کار نمیکند؟)
گاهی ممکن است از اپراتور filetype: استفاده کنید، اما نتیجهای نگیرید یا نتایج، چیزی نباشند که انتظار داشتید. معمولاً دلیل این موضوع، یک خطای فنی کوچک در نحوه جستجوی شما، یا درک نادرست از نحوه کار موتور جستجو است. عیبیابی این موارد معمولاً ساده است.
اشتباه رایج: استفاده از فاصله بعد از filetype (مثال: filetype: pdf)
این رایجترین اشتباهی است که کاربران مرتکb میشوند و کل جستجو را بیاثر میکند. اپراتورهای جستجوی گوگل نیازمند نوشتار (Syntax) دقیق هستند.
- شکل نادرست: آموزش سئو filetype: pdf
- شکل درست: آموزش سئو filetype:pdf
چرا کار نمیکند؟
وقتی شما filetype: pdf (با فاصله) را تایپ میکنید، گوگل آن را به عنوان یک دستور واحد شناسایی نمیکند. در عوض، گوگل به دنبال کلمه filetype: (که به تنهایی معنایی ندارد) و کلمه pdf (به عنوان یک کلمه کلیدی عادی در متن) میگردد.
اما وقتی filetype:pdf (بدون فاصله) را مینویسید، به گوگل دستور میدهید که یک «فیلتر» خاص را اعمال کند و نتایج را فقط به فایلهایی با پسوند PDF محدود سازد.
چرا گوگل همه فایلهای PDF را پیدا نمیکند؟ (محدودیتهای ایندکس)
این یک تصور اشتباه رایج است. اپراتور filetype: در تمام اینترنت جستجو نمیکند؛ بلکه در ایندکس گوگل (Google’s Index) جستجو میکند. اگر گوگل یک فایل PDF را ایندکس نکرده باشد، با هیچ دستوری نمیتواند آن را در نتایج به شما نشان دهد.
دلایل اصلی ایندکس نشدن یک فایل PDF عبارتند از:
- فایل مسدود شده (Blocked): ممکن است فایل PDF توسط دستور robots.txt سایت، یا از طریق هدر HTTP (با تگ X-Robots-Tag: noindex) عمداً از دسترس خزندههای گوگل مسدود شده باشد.
- عدم کشف (Not Discovered): اگر هیچ لینکی (چه داخلی و چه خارجی) به آن فایل PDF وجود نداشته باشد، خزندههای گوگل هرگز آن را پیدا نمیکنند که بخواهند ایندکس کنند. به این فایلها «یتیم» (Orphaned) گفته میشود.
- کیفیت پایین یا تکراری: گوگل ممکن است فایل را پیدا کند، اما اگر محتوای آن را کمارزش، تکراری یا اسپم تشخیص دهد، تصمیم میگیرد آن را در ایندکس خود ذخیره نکند.
بنابراین، اگر فایلی را که میدانید وجود دارد پیدا نمیکنید، به احتمال زیاد آن فایل هنوز توسط گوگل ایندکس نشده است.
استفاده از پسوندهای اشتباه یا منسوخ شده
اپراتور filetype: دقیقاً به دنبال همان پسوندی میگردد که شما تایپ میکنید. اگر پسوند را اشتباه تایپ کنید یا از نسخه منسوخ آن استفاده کنید، نتایج ناقص خواهند بود.
- اشتباه در تایپ: جستجو برای filetype:word یا filetype:excel هیچ نتیجهای نمیدهد. شما باید پسوند دقیق فایل (docx یا xlsx) را وارد کنید.
- پسوندهای قدیمی در برابر جدید:
- اسناد ورد: doc (قدیمی) و docx (جدید)
- اسناد اکسل: xls (قدیمی) و xlsx (جدید)
- اسناد پاورپوینت: ppt (قدیمی) و pptx (جدید)
اگر شما فقط filetype:xls را جستجو کنید، تمام فایلهای اکسل جدیدتر با فرمت xlsx را از دست خواهید داد. برای پوشش هر دو، همانطور که قبلاً اشاره شد، باید از عملگر OR استفاده کنید (مانند filetype:xls | filetype:xlsx).
نتیجهگیری
استفاده از رجکس نباید پیچیده باشد. تسلط بر چند الگوی اصلی که در این مطلب بررسی شد، تفاوت میان تحلیل سطحی و یک تحلیل عمیق و سفارشی را رقم میزند. با استفاده از این الگوها، شما میتوانید کنترل کاملی بر روی دادههای خود در ابزارهای تحلیلی داشته باشید و گزارشهایی دقیقتر و مفیدتر استخراج کنید. رجکس ابزاری برای فیلتر کردن دقیق است و یادگیری آن، یک سرمایهگذاری مستقیم روی کیفیت تحلیل شما محسوب میشود.