امروزه داده ها اصلی ترین و مهم ترین دارایی هر شرکت و کسب و کاری است. اهمیت روزافزون داده ها در تداوم حیات یک شرکت از یک سو و رشد تصاعدی و فزاینده آن از سوی دیگر، باعث شده است که روش های ذخیره سازی اطلاعات همواره دستخوش تغییرات و به روز رسانی هایی باشد که بتواند با شرایط متغیر سازگار شود. یکی از جدی ترین روش های ذخیره سازی داده ها که امروزه با افزایش حجم داده ها به ویژه داده های بدون ساختار مورد استقبال قرار گرفته است، معماری ذخیره سازی مبتنی بر شی یا به عبارت دیگر ObjectStorage است. در این مقاله درباره اینکه Object Storage چیست؟ و مزایای آن مطالبی بیان می شود.
آبجکت استوریج چیست
به طور خلاصه ، ذخیره سازی برای داده های بدون ساختار است که محدودیت های مقیاس بندی ذخیره سازی سنتی فایل را حذف می کند. مقیاس بی حد و حصر دلیل این است که ذخیره سازی شیء ذخیره سازی ابر است. همه سرویس های اصلی ابر عمومی ، از جمله آمازون ، گوگل و مایکروسافت ، از ذخیره سازی اشیاء به عنوان ذخیره سازی اصلی خود استفاده می کنند. فضای ابری ایرانی نودیسک نیز از ساختار آبجکت استوریج استفاده می کند
ذخیره سازی شیء مقیاس نامحدودی را ارائه می دهد زیرا-برخلاف سلسله مراتب آدرس دهی مورد استفاده در ذخیره سازی سنتی فایل-ذخیره سازی مبتنی بر شیء از یک سیستم فایل مسطح استفاده می کند که هیچ محدودیت داخلی ندارد. از این رو ، می تواند حجم عظیمی از داده های بدون ساختار مانند صدا ، تصویر ، ایمیل ، سوابق سلامت و اسناد را در خود نگه دارد.
تعریف ذخیره سازی شی
ذخیره سازی اشیاء یک فناوری است که داده ها را به عنوان اشیا مدیریت می کند. همه داده ها در یک مخزن بزرگ ذخیره می شوند که ممکن است به جای اینکه به فایل یا پوشه تقسیم شوند ، در چندین دستگاه ذخیره سازی فیزیکی توزیع شوند.
درک فضای ذخیره سازی مبتنی بر شیء با مقایسه آن با اشکال سنتی ذخیره سازی-ذخیره سازی فایل و بلاک-آسان تر است.
ذخیره سازی شیء مقیاس نامحدودی را ارائه می دهد زیرا برخلاف سلسله مراتب آدرس دهی مورد استفاده در ذخیره سازی سنتی فایل-ذخیره سازی مبتنی بر شیء از یک سیستم فایل مسطح استفاده می کند که هیچ محدودیت داخلی ندارد. از این رو ، می تواند حجم عظیمی از داده های بدون ساختار مانند صدا ، تصویر ، ایمیل ، سوابق سلامت و اسناد را در خود نگه دارد.
ذخیره سازی فایل
ذخیره سازی فایل داده ها را در پوشه ها ذخیره می کند. این روش که به ذخیره سازی سلسله مراتبی نیز معروف است ، نحوه ذخیره اسناد کاغذی را شبیه سازی می کند. هنگامی که داده ها نیاز به دسترسی دارند ، یک سیستم کامپیوتری باید آن را با استفاده از مسیر خود در ساختار پوشه جستجو کند.
ذخیره سازی فایل از TCP/IP به عنوان حمل و نقل خود استفاده می کند و دستگاه ها معمولاً از پروتکل NFS در لینوکس و SMB در Windows استفاده می کنند.
ذخیره سازی بلوک
یک فایل را به بلوک های داده جداگانه تقسیم می کند و هر یک از این بلوک ها را به عنوان یک واحد داده جداگانه ذخیره می کند. هر بلوک دارای یک آدرس است ، بنابراین سیستم ذخیره سازی می تواند داده ها را بدون نیاز به مسیر یک پوشه پیدا کند. این همچنین اجازه می دهد تا داده ها به قطعات کوچکتر تقسیم شده و به صورت توزیع شده ذخیره شوند. هر زمان که به یک فایل دسترسی پیدا کرد ، نرم افزار سیستم ذخیره سازی فایل را از بلوک های مورد نیاز جمع آوری می کند.
ذخیره سازی بلوک از FC یا iSCSI برای حمل و نقل استفاده می کند و دستگاه ها به عنوان ذخیره مستقیم متصل یا از طریق شبکه منطقه ذخیره سازی (SAN) عمل می کنند.
ذخیره سازی فایل از TCP/IP به عنوان حمل و نقل خود استفاده می کند و دستگاه ها معمولاً از پروتکل NFS در لینوکس و SMB در Windows استفاده می کنند.
ذخیره سازی اشیاء
در سیستم های ذخیره سازی شیء ، بلوک های داده ای که یک فایل یا “شی” را تشکیل می دهند ، به همراه فراداده های آن ، همه با هم نگهداری می شوند. فراداده اضافی به هر شی اضافه می شود که دسترسی به داده ها بدون سلسله مراتب را ممکن می سازد. همه اشیاء در یک فضای آدرس واحد قرار می گیرند. به منظور پیدا کردن یک شی ، کاربران یک شناسه منحصر به فرد ارائه می دهند.
ذخیره سازی مبتنی بر شیء از TCP/IP به عنوان وسیله حمل و نقل خود استفاده می کند و دستگاه ها با استفاده از API های HTTP و REST ارتباط برقرار می کنند.
فراداده بخش مهمی از فناوری ذخیره سازی اشیا است. فراداده توسط کاربر تعیین می شود و امکان تجزیه و تحلیل انعطاف پذیر و بازیابی داده ها در یک مجموعه ذخیره سازی را بر اساس عملکرد و ویژگی های آن فراهم می کند.
مزیت اصلی ذخیره سازی اشیاء این است که می توانید دستگاه ها را در استخرهای ذخیره سازی بزرگ گروه بندی کرده و آن حوضچه ها را در مکان های مختلف توزیع کنید. این نه تنها مقیاس نامحدود را امکان پذیر می کند ، بلکه انعطاف پذیری و در دسترس بودن بالای داده ها را نیز افزایش می دهد.
معماری سیستم های ذخیره سازی
با توجه به ESG ، سیستم های ذخیره سازی اجسام در مقیاس بزرگ باید بر اساس اصول معماری زیر باشد:
1- سادگی
استفاده و پیاده سازی فناوری ذخیره سازی اشیاء باید آسان باشد و برای نگهداری مداوم به حداقل تلاش نیاز دارد. عملیات مانند خوشه بندی ، شفا و تنظیم باید کاملاً خودکار باشد.
2- قابلیت برنامه ریزی
داده ها در یک سیستم ذخیره سازی شیء باید از طریق API ، معمولاً RESTful API مبتنی بر HTTP قابل دسترسی باشند. توسعه دهندگان باید بتوانند هرگونه اقدامی را در استخرهای ذخیره سازی ، به صورت برنامه نویسی انجام دهند. برنامه های کاربردی باید بتوانند اشیاء را با استفاده از فراداده خود جستجو کنند تا اشیاء مورد نیاز را بدون توجه به جایی که در یک استخر ذخیره سازی بزرگ ذخیره شده اند ، پیدا کنند.
3- انعطاف پذیری
مدیران باید بتوانند انواع مختلفی از دستگاه ها و پلتفرم های ذخیره سازی را انتخاب کرده و سخت افزارهای ناهمگن را در یک مجموعه ذخیره سازی ترکیب کنند. ذخیره سازی اشیاء نیز باید به راحتی از محیط داخلی به ابر عمومی و بالعکس گسترش یابد.
4- مصرف شبیه ابر
یک راه حل ذخیره سازی اشیاء ، چه در فضای ابری و چه در محل ، باید راهی برای اندازه گیری میزان استفاده از بخشهای مختلف سازمان داشته باشد و امکان صورتحساب هر گروه را با توجه به کاربرد واقعی آن فراهم کند.
مزایای ذخیره سازی اشیا
1- تجزیه و تحلیل داده های بزرگتر
ذخیره سازی شی توسط فراداده ها هدایت می شود و با این سطح طبقه بندی برای هر قطعه از داده ها ، فرصت تجزیه و تحلیل بسیار بیشتر است.
2- مقیاس پذیری بی نهایت
برای همیشه به افزودن داده ها ادامه دهید. هیچ محدودیتی وجود ندارد
3- بازیابی سریعتر اطلاعات
با توجه به ساختار طبقه بندی ذخیره سازی شی و عدم وجود سلسله مراتب پوشه ، می توانید داده های خود را بسیار سریعتر بازیابی کنید.
4- کاهش هزینه
با توجه به ماهیت ذخیره سازی شی ، ذخیره تمام داده های شما هزینه کمتری دارد.
5- بهینه سازی منابع
از آنجا که ذخیره سازی شیء دارای سلسله مراتب بایگانی نیست و فراداده ها کاملاً قابل تنظیم هستند ، محدودیت های بسیار کمتری نسبت به ذخیره فایل یا بلوک وجود دارد.
بیشتر بخوانید: مزایای آبجکت استوریج