ابزاری بر بستر هوش مصنوعی
هولوکلین داده‌ها را پاک‌سازی می‌کند
کد مطلب: 15293
تاریخ انتشار : دوشنبه ۹ ارديبهشت ۱۳۹۸ ساعت ۱۵:۰۰
 
هولوکلین(HoloClean)، نخستین فناوری مبتنی بر هوش مصنوعی است که می‌تواند داده‌های کثیف را تشخیص دهد و آنها را پیش از گذشتن از مرحله پردازش، تصحیح کند.
هولوکلین داده‌ها را پاک‌سازی می‌کند
 
 
Share/Save/Bookmark
پژوهشگران آمریکایی، ابزاری ابداع کرده‌اند که می‌تواند داده‌های غیرمرتبط را با سرعت و دقت بیشتری شناسایی و حذف کند.

به گزارش افتانا (پایگاه خبری امنیت فناوری اطلاعات)، ما در جهان داده‌ها زندگی می‌کنیم. بیشتر ابزار مورد استفاده ما، هوشمند هستند و کلیدها و حسگرهای گوناگونی دارند که داده‌ها را تحلیل می‌کنند و با روش‌های متفاوتی به کار می‌برند. در چنین شرایطی، ممکن است داده‌های اشتباه هم وجود داشته باشند و ارسال شوند؛ در نتیجه نیاز به شناسایی داده‌های اشتباه و پاکسازی این داده‌های موسوم به «داده‌های کثیف» احساس می‌شود. پژوهشگران دانشگاه واترلو (UWaterloo)، دانشگاه ویسکانسین- مدیسن (UW–Madison) و دانشگاه استنفورد (Stanford University)، ابزاری ابداع کرده‌اند که می‌تواند داده‌های کثیف را شناسایی و حذف کند.

داده‌های کثیف، نویزهایی هستند که با حسگرها یا الگوریتم‌های گوناگونی گردآوری می‌شوند. سیستمی که داده‌های یک وب‌سایت را تحلیل می‌کند، می‌تواند به همه انواع اطلاعات دست یابد اما لزوماً همه داده‌ها، واقعی نیستند و شاید فقط نویزهایی باشند که در همه سیستم‌های الکترونیکی وجود دارند.

این ابزار جدید موسوم به هولوکلین (HoloClean)، نخستین فناوری مبتنی بر هوش مصنوعی است که می‌تواند داده‌های کثیف را تشخیص دهد و آنها را پیش از گذشتن از مرحله پردازش، تصحیح کند. دانشمندان باور دارند که این ابزار می‌تواند برای سازمان‌های گوناگونی که با حجم گسترده‌ای از داده‌ها کار می‌کنند، مفید باشد.

بانک‌ها، شرکت‌های فعال در حوزه نرم‌افزار و بسیاری شرکت‌های دیگر با مجموعه بزرگی از داده‌ها سر‌وکار دارند. طبیعی است که در این مجموعه بزرگ، داده‌های غیرمرتبط و یا اشتباه هم وجود داشته‌باشند. هولوکلین را می‌توان طوری آموزش داد که اشتباهات را شناسایی و آنها را تصحیح کند.

آموزش هوش مصنوعی به‌تنهایی یک فرایند طولانی محسوب می‌شود، اما هولوکلین می‌تواند با سرعت کمتری داده‌ها را مورد بررسی قرار دهد، اشتباهات را تفکیک و آنها را تصحیح کند. این قابلیت، مجموعه داده پاکی را برای کاربران فراهم می‌کند تا تجزیه‌و‌تحلیل خود را به‌سادگی انجام دهند و نهایتاً نتایج دقیق‌تر و معتبرتری به‌دست آورند.

شناسایی و تصحیح داده‌ها تا به امروز به‌صورت دستی انجام شده‌است. این روش به زمان و هزینه بیشتری نیاز دارد و دقت کامل را نیز ندارد. دانشمندان امیدوارند که هولوکلین کمک کند تا این کار به‌سادگی و با سرعت و دقت بیشتری انجام شود.

سیستم‌های کنونی، مشکل را در قسمتی گزارش می‌کنند که خالی از اطلاعات است، اما این روش درست نیست. هولوکلین به جای ارائه اطلاعاتی که وجود ندارند، اطلاعات اشتباهی که درست جلوه می‌کنند، شناسایی و حذف می‌کند.
مرجع : خبرگزاری ايسنا