TechBord Logo
TechBord detail

سنگ زنی سند (Document Grinding) چیست؟

سنجش سند فرآیند تجزیه و تحلیل سند (Document) برای استخراج داده های معنی دار است. این اصطلاح اغلب با هک رایانه همراه است، زیرا هکر (Hacker) ممکن است اسناد را برای افشای داده های محرمانه "خرد" کند. با این حال، سنگ زنی اسناد نیز برای اهداف غیر مخرب استفاده می شود. به عنوان مثال می‌توان به شناسایی نوع فایل (File Type) ناشناخته و مشاهده فایل ابرداده (Metadata) اشاره کرد.

امکان سنگ‌زنی سند در متن ساده (Plain Text) و دودویی (Binary)

فایل‌های متنی

صاف کردن فایل‌های متنی فرآیند ساده‌ای است زیرا داده‌ها را به صورت متن ساده ذخیره می‌کنند. می توانید شخصیت (Character) و رشته (String) را در یک سند متنی با استفاده از ابزاری مانند گرپ (Grep) یا ابزار جستجوی دیگر جستجو کنید. از آنجایی که پردازش متن یک عملیات رایانه‌ای نسبتاً سریع است، ممکن است بتوان چندین سند بزرگ را در کمتر از یک ثانیه خرد کرد.

انواع فایل متنی رایج که برای سنگ‌زنی اسناد مورد هدف قرار می‌گیرند شامل فایل‌های گزارش می‌شوند ( ()، ()) و فایل های پیکربندی ( ()، ()). برای مثال، اگر یک هکر به وب سرور (Web Server) دسترسی پیدا کند، ممکن است این فایل‌ها را برای نام کاربری (Username)، کلمه عبور (Password) و سایر داده‌های محرمانه جستجو کند.

< h3>فایل های باینری

فایل های باینری ممکن است حاوی مقداری متن ساده باشند، اما داده (Data) باینری - 1 و 0 را نیز ذخیره می کنند. خرد کردن داده های باینری دشوارتر است زیرا نمی توان آنها را با ابزار جستجوی متن جستجو کرد. علاوه بر این، بسیاری از فایل های باینری در یک فرمت فایل (File Format) اختصاصی ذخیره می شوند که تجزیه (Parse) بدون برنامه کاربردی (Application) مربوطه دشوار است. بنابراین سنگ زنی سند باینری معمولاً بر روی سرتیتر (Header) و پاورقی (Footer) یک سند متمرکز می شود که ممکن است حاوی متن ساده باشد. همچنین ممکن است هدف آن استخراج فراداده فایل باشد.

بسیاری از فایل های باینری حاوی اطلاعاتی در مورد نوع فایل در سربرگ فایل (File) هستند. به عنوان مثال، در تصویر نمونه، حروف "PNG" در هدر نشان می دهد که فایل یک تصویر گرافیک شبکه قابل حمل (PNG) است. این اطلاعات برای شناسایی نوع فایل مفید است زیرا پسوند فایل (File Extension) ندارد. به طور مشابه، عکس‌های دیجیتال اغلب حاوی داده‌های پنهان فرمت فایل تصویری قابل تعویض (EXIF) هستند که هنگام عکس‌برداری ذخیره می‌شوند. یک برنامه مشاهده تصویر یا یک سند سنگ زنی اسکریپت (Script) ممکن است بتواند این اطلاعات را شناسایی و استخراج کند.

تعریف اصطلاح سنگ زنی سند (Document Grinding) توسط تک بورد

تعریف سنگ زنی سند (Document Grinding) در این صفحه یک تعریف پایه نگاشته شده توسط تک بورد است. اگر مایل به ارجاع به این صفحه یا استناد به این تعریف هستید، با شرط درج لینک به این صفحه می توانید از این محتوا استفاده کنید.

هدف تک بورد توضیح اصطلاحات کامپیوتری به روشی است که به راحتی قابل درک باشد. ما برای سادگی و دقت با هر تعریفی که منتشر می کنیم تلاش می کنیم. اگر بازخوردی درباره تعریف سنگ زنی سند (Document Grinding) دارید یا می‌خواهید یک اصطلاح فنی جدید پیشنهاد کنید، لطفاً با ما تماس بگیرید.

آیا می خواهید اصطلاحات فنی بیشتری یاد بگیرید؟ در خبرنامه روزانه یا هفتگی مشترک شوید و شرایط و آزمون های ویژه را در ایمیل خود تحویل بگیرید.