کد QR مطلبدریافت صفحه با کد QR

مقدمه‌ای بر بزرگ‌داده‌ها

14 تير 1394 ساعت 9:02

مدیریت اطلاعات و داده‌ها این روزها برای شرکت‌ها و سازمان‌های دولتی نقش اساسی را بازی می‌کند و به‌نوعی می‌توان گفت مجموعه‌ای موفق‌تر است که استراتژی‌های خود را بر اساس بررسی بزرگ‌داده‌ها بنا کند. از طرف دیگر این امر را نیز باید در نظر داشت که بزرگ‌داده‌ها در واقع تنها فناوری و تکنیک جدید و نوظهور نیستند، بزرگ‌داده‌ها مسیر حرکت کسب و کار و فرآیند چرخش کار در سازمان‌ها را مشخص می‌کنند.


مدیریت اطلاعات و داده‌ها این روزها برای شرکت‌ها و سازمان‌های دولتی نقش اساسی را بازی می‌کند و به‌نوعی می‌توان گفت مجموعه‌ای موفق‌تر است که استراتژی‌های خود را بر اساس بررسی بزرگ‌داده‌ها بنا کند. از طرف دیگر این امر را نیز باید در نظر داشت که بزرگ‌داده‌ها در واقع تنها فناوری و تکنیک جدید و نوظهور نیستند، بزرگ‌داده‌ها مسیر حرکت کسب و کار و فرآیند چرخش کار در سازمان‌ها را مشخص می‌کنند. 

به گزارش افتانا (پایگاه خبری امنیت فناوری اطلاعات)، در بزرگ‌داده با داده‌های متمایز و بزرگ که دائماً از لحاظ حجم، نرخ تولید داده و تنوع در حال تغییر هستند سروکار داریم. 

برای اینکه مفهوم Big Data در ذهن شما تداعی بیشتری داشته باشد به مثال‌های زیر دقت کنید: 
مدیران فروشگاه‌های خرده فروشی آنلاین که روزانه هزاران خریدار دارند می‌توانند با بررسی رفتار کاربران در وبسایت، میزان قیمت و همچنین موجودی کالای خود را زیر نظر داشته باشند. در ابعاد وسیع‌تر دولت‌ها قادر هستند تا بیماری‌های واگیردار را که در شبکه‌های اجتماعی از آنها سخن به میان می‌آید در نقاط مختلف جغرافیایی شناسایی کنند. همچنین شرکت‌های نفت و گاز با بررسی بزرگ‌داده جمعآوری شده از حفاری، تصمیم‌های دقیق و مؤثرتری اتخاذ کنند. 

داده‌ها در بزرگ‌داده باید برای تصمیم گیری در خصوص موارد کاربردی متفاوت، به صورت صحیح مدیریت شوند. 

برای مدیریت بزرگ‌داده‌ها عوامل زیر در نظر گرفته می‌شود:
حجم داده اگر از گذشته با کامپیوتر سروکار داشته باشید، به‌خوبی می‌دانید کامپیوتری که ۱۵ سال پیش از آن استفاده می‌کردیم، دارای هاردی با ظرفیت حدودی ۱۰ گیگابایت بود؛ اما شاید برای شما جالب باشد که روزانه در فیسبوک حدود ۵۰۰ ترابایت اطلاعات جدید ایجاد می‌شود و اطلاعات جمع‌آوری شده هواپیمای بوئینگ ۷۳۷ بیشتر از ۲۴۰ ترابایت به‌ازای هر پرواز است. 

نرخ تولید میلیون‌ها فرآیند مختلف در وب‌سایت‌های بزرگ توسط کاربران در کسری از ثانیه انجام می‌شود، الگوریتم‌هایی که مشخص‌کننده ارزش سهام هستند به‌صورت بلادرنگ تغییر می‌کنند، در شبکه‌های بازی آنلاین نیز شاهد تغییر و ذخیره سازی اطلاعات بازیکنان به صورت لحظه به لحظه هستیم. 

تنوع بزرگ‌داده فقط شامل اعداد، تاریخ‌ها و رشته‌ها (Strings) نیست؛ تصاویر ماهوارهای و عکس‌های هوایی، اطلاعات سه‌بعدی، فایل‌های متنی ساختار نیافته (نظیر لاگ شبکه‌های ویدئویی)، بزرگ‌داده‌هایی را تشکیل می‌دهند که از تنوع بسیار زیادی برخوردارند. 

وقتی صحبت از Big Data به میان می‌آید، ابزار نگهداری و مدیریت این حجم بزرگ داده معنی پیدا می‌کند، چرا که بانک‌های اطلاعاتی معمولی دیگر قادر به مدیریت بزرگ‌داده‌ها نیستند. 

اینجاست که دیتابیس‌های بزرگ نظیر MongoDB برای مدیریت و بررسی بزرگ‌داده‌ها به کمک می‌آیند.

به خدمت گرفتن دیتابیس‌های بزرگ در سازمان‌ها
دیتابیس‌های بزرگ با کنترل بزرگ‌داده‌ها سازمان‌ها را قادر می‌کند تمرکز بیشتری بر روی اهداف خود داشته باشند و آنها را به سمت سودآوری بیشتر هدایت می‌کنند.
آنالیز بزرگ‌داده‌ها به نهادهای تجاری کمک می‌کند تا بی‌درنگ میلیون‌ها رکورد آماری را در خصوص کالاها، منابع موجود و مشتریان جمع‌آوری کرده و بدون وقفه آنالیز جدیدی از به کارگیری منابع ارائه دهد. 

برای اینکه مفهوم به کارگیری دیتابیس بزرگ برای آنالیز بزرگ‌داده‌ها بهتر در ذهن نقش بگیرد، مثال زیر خالی ازلطف نیست:
شهری بزرگ در آمریکا را در نظر بگیرید که از دیتابیس بزرگ MongoDB برای کاهش جرم و بهبود خدمات شهرداری استفاده می‌کند و عملیات جمع‌آوری و بررسی تصاویر ماهوارهای به صورت زنده از ۳۰ سازمان مختلف انجام می‌شود؛ بدیهی است که تعامل با بزرگ‌داده به‌دست آمده تنها از عهده دیتابیس‌های بزرگ برخواهد آمد. 

اینجاست که به‌کارگیری بزرگ‌داده در بستر دیتابیس‌های بزرگ به کمک آمده و کاهش چشم‌گیری در هزینه‌ها ایجاد خواهد کرد. 

از طرف دیگر متن‌باز بودن تکنولوژی‌های مورد استفاده در بزرگ‌داده‌ها باعث می‌شود تا با کمترین هزینه به بهترین نحو ممکن بتوان آن را با شرایط سیستمی سازمان موردنظر تطبیق داد. 

در مثال ذکر شده، انتقال داده‌ها از بانک اطلاعاتی فعلی به دیتابیس MongoDB که متن باز می‌باشد باعث صرفه‌جویی زیادی در هزینه خرید لایسنس می‌شود. 

از طرف دیگر بررسی بزرگ‌داده‌های جمع‌آوری شده منجر به چالاکی بیشتر سازمان نسبت به سایر رقبای تجاری خواهد شد. جمع‌آوری سریع اطلاعات مشترک در قسمت‌های مختلف سازمان و سرعت بخشیدن به فرآیند آپدیت این اطلاعات به تشخیص مشکلات مشتریان و برطرف نمودن هرچه سریع‌تر موانع کمک خواهد کرد؛ بدیهی است که این امر بهبود میزان وفاداری مشتریان را در درازمدت به دنبال خواهد داشت. 

راهکارهای پیشرو در به کارگیری Big Data
دو گزینه برای استفاده از بزرگ‌داده‌ها وجود دارد: راه‌حل عملیاتی و راه‌حل تحلیلی بزرگ‌داده‌ها تحت تأثیر دو تکنولوژی واقع شده‌اند، اول سیستم‌هایی که اطلاعات را در هنگام بارگذاری و ذخیره شدن بررسی می‌کند و مورد دوم سیستم‌هایی که امکان تحلیل داده‌ها را برای مراجعات بعدی فراهم می‌کنند. البته لازم به ذکر است که متخصصان در بیشتر مواقع هر دو شیوه را برای دست‌یابی به نتیجه دقیق‌تر به‌کار می‌گیرند. 

دیتابیس‌هایی نظیر NoSQL بزرگ‌داده‌ها را به شیوه عملیاتی بررسی می‌کنند و تمرکز بیشتری در قسمت‌های درخواست شده دارند تا آنالیز رخدادها به‌صورت هم‌زمان صورت پذیرد. 

از طرف دیگر دیتابیس‌هایی که از شیوه‌های تحلیلی استفاده می‌کنند، تمایل بیشتری به بررسی تمامی رخدادها دارند و در عملیات آنالیز تمامی داده‌ها در لحظه انجام می‌شود.

رایانش ابری و بزرگ‌داده‌ها
وقتی صحبت از رایانش ابری به میان می‌آید در واقع منظور حجم زیادی از محاسبات کامپیوتری و نرمافزارهای مختلف است که سرویس به خصوصی را از طریق شبکه اجرا می‌کنند. تاکنون شیوه سِلف‌هاستینگ (Self Hosting) برای تعامل با بزرگ‌داده‌ها استفاده می‌شده است اما رایانش ابری در تمامی تکنولوژی‌های کامپیوتری نفوذ داشته است و بزرگ‌داده‌ها نیز از این قاعده مستثنی نیستند. هزینه نگهداری سیستم‌ها در شیوه سلف‌هاستینگ به صورت دائم محاسبه می‌شود اما در رایانش ابری تنها زمان به خدمت گرفتن سرویس مورد نظر، هزینه‌ها لحاظ خواهند شد. 

با این حساب اگر بخواهیم سلف‌هاستینگ را با یکی از شیوه‌های رایانش ابری، برای مثال IaaS، در تعامل با داده‌های کلان مقایسه کنیم موارد زیر را می‌توان به عنوان دلایل برتری رایانش ابری ذکر کرد. کم‌هزینه بودن، قابل طراحی با نیاز سازمان، انعطاف پذیری بالا، تعریف و تغییر حجم و پهنای باند دلخواه، سازگاری با شرایط مختلف و قابل اطمینان بودن، از مزایای شیوه نگهداری بزرگ‌داده‌ها با استفاده از فناوری رایانش ابری است. در مجموع اگر بخواهیم در یک جمله مزایای رایانش ابری را ذکر کنیم، می‌توان گفت که استفاده از رایانش ابری به چالاکی مجموعه کمک کرده و از طرف دیگر هزینه‌های کمتری را نیز به کارفرما تحمیل می‌کند. 

همان‌طورکه در بالا اشاره شد، بانک اطلاعاتی NoSQL گزینه مناسبی برای استفاده بزرگ‌داده‌ها به حساب می‌آید و از طرف دیگر با رایانش ابری نیز سازگاری کامل دارد. نکته جالبی که در خصوص دیتابیس‌های NoSQL وجود دارد، امکان مدیریت حجم زیادی از اطلاعات می‌باشد که بر روی سرورهای متخلف مستقر هستند. 

معماری دیتابیس NoSQL این امکان را می‌دهد که اطلاعات به صورت دسته‌بندی شده در جداول متفاوت و در محل‌های مجزا ذخیره شوند. 

با تعاریفی که در خصوص دیتابیس MongoDB و سایر بانک‌های اطلاعاتی که از معماری NoSQL بهره می‌برند، به میان آمد، می‌توان گفت که به‌کارگیری این‌گونه دیتابیس‌ها بهترین گزینه برای استفاده از بزرگ‌داده‌ها در فضای ابری می‌باشند.

ادغام راه‌حل عملیاتی و راه‌حل تحلیلی با یکدیگر توسط هادوپ (Hadoop)
هادوپ درواقع چهار چوب متنباز برای ذخیره سازی و پردازش بزرگ‌داده‌هاست که توسط شرکت آپاچی پشتیبانی می‌شود، این تکنولوژی با ترکیب و توزیع داده به ذخیره سازی آن می‌پردازد و به زبان جاوا پیاده‌سازی شده است، جالب است بدانید که در حال حاضر شرکت‌های بزرگی نظیر فیس بوک، یاهو و گوگل از هادوپ استفاده می‌کنند. 

در این بین استفاده از بانک اطلاعاتی که از معماری NoSQL پشتیبانی می‌کند نظیر MongoDB به همراه هادوپ گزینه‌ای بسیار مناسب برای تعامل با بزرگ‌داده‌ها می‌باشد. دیتابیس‌هایی که از معماری Mpp (تعداد زیادی از پردازنده‌ها، یا رایانه‌های جدا از هم، که با یکدیگر محسابات هماهنگی را به صورت موازی انجام می‌دهند) بهره گرفته‌اند را نیز برای تعامل با بزرگ‌داده‌ها می‌توان به خدمت گرفت. در این روش به کارگیری دیتابیس Mpp در کنار استفاده از فناوری هادوپ و NoSQL منجر به ثبت و استخراج گزارش‌های بسیار دقیقی می‌شود که به اتخاذ تصمیمات مهمی از جانب شرکت‌های بزرگ منتهی خواهد شد. 

البته این نکته را نیز باید اضافه کرد که تکنولوژی و راه‌حل‌های پیشنهادی برای استقرار بزرگ‌داده‌ها به بلوغ کامل رسیده اما هنوز به‌طور کامل در جوانب مختلف به‌کار گرفته نشده است. 

در مجموع باید گفت که سازمان‌های بزرگ چاره‌ای به غیر از انتخاب و استفاده از بزرگ‌داده‌ها ندارند و دیر یا زود شاهد انتقال اطلاعات سازمان‌ها از بانک‌های اطلاعاتی فعلی که عمدتاً غیرمتمرکز هم هستند به دیتابیس‌های بزرگ که بزرگ‌داده‌ها را مدیریت و پردازش می‌کنند، خواهیم بود. 
منبع: ماهنامه دیده‌بان فناوری-شماره نخست


کد مطلب: 9766

آدرس مطلب :
https://www.aftana.ir/news/9766/مقدمه-ای-بزرگ-داده-ها

افتانا
  https://www.aftana.ir