دیتابیس (Database) چیست؟
دیتابیس یا پایگاه داده ستون فقرات همه سیستمهای اطلاعاتی مدرن است. پایگاه داده مجموعهای سازمان یافته از دادههای ذخیره شده و الکترونیکی از یک سیستم کامپیوتری است. از آنجایی که کامپیوترها دیتابیس را ذخیره میکنند، دادهها میتوانند در هر اندازه (حجم) و پیچیدگی باشند. روشهای زیادی برای جمع آوری و ترتیب دادهها بسته به نوع استفاده و نوع داده وجود دارند. در این بررسی از پینگونت ما یک نمای کلی از پایگاههای داده و سیستمهای مربوط به آن را مورد بحث قرار میدهیم.
داده چیست؟
داده مجموعهای از یک واحد کوچک از اطلاعات است که میتواند در اشکال مختلف مانند متن، اعداد، تصویر، ویدئو و غیره تشکیل شده باشد. میتوان داده را روی کاغذ یا حافظه دیجیتالی و غیره ذخیره کرد. کلمه داده از «datum» به معنای تک اطلاعات گرفته شده است. در دنیای امروز، حفظ و بازیابی دادهها از اهمیت بالایی برخوردار است.
تعریف دیتابیس
دیتابیس (Database) مجموعهای سازمان یافته از دادهها یا اطلاعات است که به طور ویژه برای جستجو و بازیابی سریع توسط کامپیوتر سازماندهی شده است. پایگاههای داده برای تسهیل در ذخیره سازی، بازیابی، اصلاح و حذف دادهها در ارتباط با عملیاتهای مختلف پردازش اطلاعات به شکلی ساختاریافته طراحی میشوند.
هدف اصلی پایگاه داده این است که حجم زیادی از اطلاعات را از طریق ذخیره، بازیابی و مدیریت داده ها به کار گیرد. جدا از ذخیره اطلاعات، یک پایگاه داده روابط بین نقاط داده را نیز حفظ میکند. در مفهوم گستردهتر، دیتابیس مجموعهای یکپارچه از اطلاعات در مورد یک سیستم و رویههای نگهداری و استفاده است.
تاریخچه دیتابیس
اولین پایگاه داده خودکار به «هرمان هولریث» مربوط میشود که یک سیستم خاص را برای پردازش خودکار دادهها در سال 1884 به ثبت رساند. سرشماری سال 1890 ایالات متحده از سیستم شمارنده کارتهای پانچ استفاده کرد و مجموعه کارتها نشان دهنده اولین سیستم پایگاه داده خودکار بود. هر کارت دارای 80 ستون و اطلاعات مشخص شده در مورد یک شخص بود.
معمولاً پردازش اطلاعات سرشماری دو سال طول میکشد. با این حال، سیستم کارت پانچ و مکانیسم خودکار خواندن کارت، تنها حدود شش هفته طول کشید تا دادهها را پردازش کند. سیستم کارتهای پانچ شده در سراسر قرن بیستم مورد استفاده قرار گرفت. پس از جنگ جهانی دوم، شرکتها و مؤسسات دولتی شروع به استفاده از کامپیوتر برای پایگاه دادههای حسابداری خطی ساده کردند. اولین پایگاههای داده کامپیوتری برای کارهای خاص مورد استفاده قرار گرفتند و فاقد انعطاف پذیری بودند.
در دهه 1960 پایگاه دادههای اسناد نقش مهمی داشتند. اولین سیستمهای مدیریت دیتابیس در این دهه ظاهر شد و برای پروژههای بزرگ و پیچیده مانند فرود آپولو در ماه مورد استفاده قرار گرفتند. پایگاههای داده در دهه 1970 به یک واقعیت تجاری تبدیل شدند. سیستمهای سلسله مراتبی و شبکهای برای مدیریت دادهها، عمدتاً برای مدیریت ساختارهای داده پیچیده مانند حسابهای محصولات تولیدی در کارخانه و خرید مواد خام معرفی شدهاند. در این دهه اولین نسل از سیستم مدیریت دیتابیس معرفی شد که اشکالات زیر را داشت:
- بازیابی دادهها سخت بود. شرکتها در دهه 1970 از برنامههای پیچیدهای برای دسترسی به دادههای ساده استفاده میکردند.
- تغییر و به روز رسانی اطلاعات سخت بود.
- هیچ پایه نظری برای هیچ مدل پایگاه داده وجود نداشت.
دیتابیس در دهه 80 و 90
سیستم مدیریت دیتابیس در دهه 1980 وارد بازار شد. هنگام استفاده از مدل رابطهای، تمام دادهها در قالب جدول ارائه میشدند. یک زبان برنامه نویسی نسبتا ساده (SQL)، دادهها را از دیتابیس بازیابی میکرد. مدل پایگاه داده جدید، دسترسی آسانتر به دادهها را برای افرادی که برنامه نویس نبودند، امکان پذیر میکرد و مهمترین مشکل مدلهای قبلی را برطرف مینمود. مدل رابطهای برای ارتباط کلاینت سرور که انتقال موازی داده و رابط کاربری گرافیکی را ساده تر میکرد، در این دهه ظاهر شد.
دهه 1990 باعث پیدایش برنامههای کاربردی اینترنتی و سیستمهای ذخیره سازی دادهها شد و دادههای چند رسانهای (گرافیک، صدا، تصاویر و ویدئو) رایجتر شدند. مقادیر عظیمی از دادههای ساختاریافته و بدون ساختار وجود داشتند. با توجه به افزایش پیچیدگی دادهها، سیستمهای پایگاه داده رابطهای به رویکرد شیگرا روی آوردند.
دیتابیس در شروع قرن بیست و یک
سه نوع پایگاه داده جدید در آغاز قرن بیست و یکم ظاهر شدند که شامل پایگاه دادههای XML، NoSQL و NewSQL بودند. پایگاه دادههای XML مبتنی بر سند بسیار ساختار یافته است. انجام کوئری از طریق ویژگیهای XML با درجات مختلف انعطاف پذیری در این نوع دیتابیس قابل انجام است.
پایگاههای داده NoSQL به تقاضای قوی برای سیستمهای پایگاه داده توزیع شده بسیار انعطاف پذیر پاسخ میدهند. نوع NoSQL بسیار مقیاس پذیر است و دادههای غیرعادی را ذخیره میکند. هدف NewSQL ترکیب بهترین ویژگیها از پایگاههای داده NoSQL مانند مقیاس پذیری، استفاده از SQL و حفظ انطباق با ACID است.
اجزای دیتابیس
پنج جزء اصلی یک سیستم دیتابیس به شرح زیر هستند:
سخت افزار
سخت افزار شامل دستگاههای فیزیکی است که کامپیوترها را به دنیای واقعی متصل میکند. وقتی صحبت از پایگاه داده میشود، سرورها، دیسکهای ذخیره سازی و دستگاههای مختلف جمع آوری دادهها جزء سخت افزارهای مورد نیاز برای اجرا و پر کردن پایگاه داده محسوب میشوند.
نرم افزار
این نرم افزار شامل مجموعه وسیعی از برنامههای مورد استفاده برای دسترسی، دستکاری و کنترل پایگاههای داده است. در سطوح پایینتر، نرم افزار شامل سیستم عاملهایی است که پایگاههای اطلاعاتی روی آنها قرار دارند.
دادهها
دادهها واقعیت اساسی در مورد یک آیتم یا رویداد هستند که دیتابیس میتواند آنها را ذخیره کند. دادهها برای معنابخشی و تبدیل شدن به اطلاعات، نیاز به پردازش دارند. علاوه بر این، پردازش باعث آشکار شدن جزئیات و استخراج دادههای مورد نیاز میشود.
رویهها
رویههای پایگاه داده شامل تمام عملکردهایی هستند که در یک ساختار ذخیره سازی کار میکنند. خواه پشتیبان گیری معمولی باشد، خواه تولید گزارشها و سایر عملیاتهای روزمره، رویهها مجموعه دستورالعملهایی هستند که در سیستم مدیریت پایگاه داده اجرا میشوند.
زبان دسترسی
زبان دسترسی به پایگاه داده، زبان برنامه نویسی است که برای درج، به روز رسانی، حذف و اصلاح دادههای ذخیره شده در پایگاه داده اشاره دارد.
اهمیت دیتابیس
یک سیستم پایگاه داده، دادههای ضروری در مورد یک کسب و کار را ذخیره میکند. سپس دادهها هنگامی که مورد آنالیز قرار میگیرند، به اطلاعات ارزشمندی در مورد یک شرکت تبدیل میشوند تا به فرآیند تصمیم گیری کمک کنند. به همین ترتیب، یک پایگاه داده به ایجاد آرشیو اطلاعاتی در مورد کسب و کار کمک میکند و سازمان را قویتر میسازد.
ذخیره دادههای مربوط به یک تعامل، به ارائه بینشی دقیق در مورد اطلاعات کمک میکند تا به توسعه بیشتر سازمان و افزایش سود یاری میرساند. اهمیت استفاده از یک سیستم پایگاه داده به شرح زیر است:
- استقلال بین برنامهها و دادهها: جداسازی ابرداده از برنامههایی که از داده استفاده میکنند، یک ویژگی کلیدی است. ویژگی اصلی پایگاه داده، توانایی تغییر و انتقال دادههای یک سازمان به یک سیستم کامپیوتری متفاوت است. این مهم بدون تغییر برنامههایی انجام میشود که اطلاعات را پردازش میکنند.
- امنیت بیشتر دادهها: یک سیستم مدیریت دیتابیس دارای عملکردهای مدیریتی است که به کنترل امنیت اطلاعات حساس از طریق امتیازات و نقشهای کاربری کمک میکند.
- افزایش بهره وری و توسعه: توسعه برنامههای جدید به لطف سیستمهای پایگاه داده سریعتر پیش میرود. یک برنامه نویس میتواند بدون نیاز به تعریف داده، روی عملکردهای لازم برای یک برنامه جدید تمرکز کند. یک سیستم مدیریت دیتابیس به خودکارسازی فعالیتهایی مانند طراحی و پیاده سازی پایگاه داده کمک میکند.
فواید دیتابیس
در مقایسه با سیستم مدیریت داده مبتنی بر فایل، سیستم مدیریت پایگاه داده مزایای بسیاری به همراه دارد. برخی از فواید این سیستم در زیر آورده شدهاند:
1- کاهش افزونگی دادهها
سیستمهای مدیریت داده مبتنی بر فایل، حاوی چندین فایل بودند که در مکانهای مختلف در یک سیستم یا حتی در چندین سیستم ذخیره میشدند. به همین دلیل، گاهی اوقات چندین نسخه از یک فایل وجود دارند که منجر به افزونگی دادهها میشوند. از افزونگی در یک پایگاه داده جلوگیری میشود زیرا یک پایگاه داده واحد وجود دارد و هر تغییری در آن بلافاصله منعکس خواهد شد. به همین دلیل، هیچ شانسی برای مواجهه با دادههای تکراری وجود ندارد.
2- به اشتراک گذاری دادهها
در یک پایگاه داده، کاربران میتوانند دادهها را بین خود به اشتراک بگذارند. سطوح مختلفی از مجوز برای دسترسی به دادهها وجود دارند و در نتیجه دادهها را میتوان تنها بر اساس پروتکلهای مجوز به اشتراک گذاشت. بسیاری از کاربران دورکار نیز میتوانند به طور همزمان به پایگاه داده دسترسی داشته باشند و دادهها را بین خود به اشتراک بگذارند.
3- یکپارچگی دادهها
یکپارچگی داده به این معناست که دادهها در دیتابیس دقیق و سازگار هستند. یکپارچگی دادهها بسیار مهم است زیرا چندین پایگاه داده در یک سیستم مدیریت پایگاه داده وجود دارند. همۀ این پایگاههای داده حاوی اطلاعاتی هستند که برای چندین کاربر قابل مشاهده میباشند. بنابراین لازم است مطمئن شوید که دادهها در همه دیتابیسها و برای همه کاربران یکپارچه است.
4- امنیت دادهها
امنیت داده مفهومی حیاتی در پایگاه داده است. فقط کاربران مجاز باید اجازه دسترسی به پایگاه داده را داشته باشند و هویت آنها باید با استفاده از نام کاربری و رمز عبور احراز هویت شود. کاربران غیرمجاز نباید تحت هیچ شرایطی اجازه دسترسی به پایگاه داده را داشته باشند.
5- حفظ حریم خصوصی
قانون حفظ حریم خصوصی در پایگاه داده به این معناست که فقط کاربران مجاز میتوانند به پایگاه داده با توجه به محدودیتهای حریم خصوصی آن دسترسی داشته باشند. سطوح مختلف دسترسی به پایگاه داده وجود دارند و کاربران فقط میتواند دادههایی که مجاز به استفاده هستند را ببینند.
6- پشتیبان گیری و بازیابی
کاربران نیازی به پشتیبان گیری دوره ای از دادهها ندارند زیرا این امر توسط سیستم مدیریت پایگاه داده انجام میشود. به علاوه، پشتیبان گیری میتواند دیتابیس را پس از خرابی سیستم به شرایط قبلی خود بازیابی کند.
7- سازگاری دادهها
سازگاری دادهها در پایگاه داده تضمین میشود زیرا هیچ افزونگی داده وجود ندارد. همه اطلاعات به طور مداوم در پایگاه داده ظاهر میشوند و دادهها برای همه کاربرانی که دیتابیس را مشاهده میکنند، یکسان هستند. علاوه بر این، هر تغییری که در پایگاه داده ایجاد شود، بلافاصله به همه کاربران منعکس شده و هیچ تناقضی در دادهها وجود ندارد.
کاربردهای دیتابیس
پایگاه داده کاربردهای گستردهای دارد که رایجترین آنها عبارتند از:
- سیستمهای بانکی: این سیستمها اطلاعات را برای مشتریان، حسابهای بانکی، اعتبارات، تراکنشها و سایر نگهداری میکنند.
- ترافیک خطوط هوایی: اطلاعات مربوط به پروازها، رزرو بلیط و موارد مشابه را حفظ میکند. شرکتهای هواپیمایی اولین بخشی هستند که از پایگاههای داده توزیع شده جغرافیایی استفاده میکنند.
- دانشگاهها: از پایگاههای داده برای ثبت اطلاعات در مورد دانشجویان، برنامههای کاربردی، نمرات، دورهها و سایر استفاده میشود.
- تراکنشهای کارت اعتباری: حاوی برگههایی در مورد پرداختها هستند و گزارشهای ماهانه تولید میکنند.
- شرکتهای مخابراتی: اطلاعات تماسها را ذخیره میکنند، صورتحسابهای ماهانه را تولید میکنند و خط ارتباطی را مورد ردیابی قرار میدهند.
- بخش مالی: فروش و خرید ابزارهای مالی مانند اوراق قرضه و سهام را دنبال میکند.
- تجارت الکترونیک: دادههای مربوط به مصرف کنندگان، محصولات و کاتالوگهای مختلف قیمت را ذخیره میکند.
- کسب و کارهای تولیدی: زنجیره تأمین، خطوط تولید، انبارها، تولید فاکتورها و سایر را مدیریت میکند.
- منابع انسانی: اطلاعات مربوط به کارکنان، چک حقوق، مالیات، مزایا و سایر را ذخیره میکند.
فهرست بالا نشان میدهد که دیتابیس برای هر نوع کسب و کاری چقدر حیاتی است.
انواع پایگاه داده
در حال حاضر انواع مختلفی از دیتابیس وجود دارند که هر کدام دارای مزایا و معایب مختص به خود هستند. هر نوع پایگاه داده یک محیط خاص برای ذخیره دادهها و رابطه بین اطلاعات ایجاد میکند. انواع پایگاه داده به شرح زیر هستند:
- پایگاه دادههای رابطهای: دادهها را در ساختارهای جدول مانند به صورت ردیف و ستون با تمرکز بر سازگاری دادهها ذخیره میکند. این نوع پایگاه داده بر روابط بین دادهها تمرکز دارد و پرکاربردترین نوع پایگاه داده است.
- پایگاه دادههای شی گرا: اصول برنامه نویسی شی گرا (OOP) را با استانداردهای پایگاه داده رابطهای ترکیب میکند.
- پایگاههای داده توزیع شده: در چندین سایت پخش شده و به صورت افقی مقیاس بندی میشوند.
- انبارهای داده: دادهها را از منابع مختلف به طور مداوم در یک سیستم پشتیبانی تصمیم واحدی ادغام میکند. انبارها حجم زیادی از دادهها را تأمین میکنند و معمولاً در سرورهای کلان داده قرار دارند.
- پایگاههای داده NoSQL: از نظر ساختاری بر دسترسی بالا تمرکز دارند. سیستمهای NoSQL برای حجم زیادی از دادههای بدون ساختار مناسب هستند.
- پایگاه دادههای گراف: با ساختار شبکه توپوگرافی، پایگاههای داده گراف، بهترین سیستم برای کاوش و کشف روابط اطلاعاتی هستند.
- پایگاههای داده OLTP: بر تراکنشهای کوتاه روزانه تمرکز دارند و از یک پایگاه کاربری بزرگ با یکپارچگی دادهها و اثربخشی بالا در کوئریهای همزمان پشتیبانی میکنند.
- پایگاههای داده منبع باز: برای تغییرات باز هستند و استفاده از آنها رایگان میباشد. تنظیمات قابل تنظیم و داشتن هزینه کم باعث شده است تا این نوع دیتابیس به طور گسترده مورد استفاده قرار گیرد.
- پایگاه دادههای ابری: دارای تمام ویژگیهای پایگاه داده سنتی با انعطاف پذیری رایانش ابری است.
- پایگاه دادههای چند مدلی: یک موتور واحد را برای کار با انواع مدلهای پایگاه داده چندگانه ارائه میدهد.
- پایگاه داده Document/JSON: یک سیستم ذخیره سازی NoSQL است که دادهها را در اسناد JSON ذخیره میکند.
- پایگاه دادههای ابری خودران (پایگاههای اطلاعاتی مستقل): از یادگیری ماشین برای خودکارسازی (اتوماسیون) وظایف مختلف در سیستم مدیریت دیتابیس استفاده میکند.
سیستم مدیریت پایگاه داده چیست؟
یک سیستم مدیریت پایگاه داده (DBMS) به عنوان رابط بین کاربر یا برنامههای کاربردی و پایگاه داده عمل میکند. این سیستم امکان ارتباط مستقیم با پایگاه داده، امکان بازیابی دادهها، به روز رسانی، بهینه سازی و مدیریت کلی اطلاعات ذخیره شده در دیتابیس را فراهم میکند.
سرور پایگاه داده چیست؟
سرور پایگاه داده یک سرور اختصاصی است که از طریق برنامههای کاربردی پایگاه داده به مشتری خدمات ارائه میدهد. یک قسمت از سرور سیستم مدیریت دیتابیس را ذخیره میکند، بخش دیگر، خود پایگاه داده را ذخیره مینماید. معمولاً سرورهای پایگاه داده دارای ظرفیت ذخیره سازی و حافظههای زیادی هستند.
چالشهای رایج در دیتابیس
آموزش کارکنان |
کسب و کاری که سیستم پایگاه داده را انتخاب میکند، باید افرادی را برای طراحی، پیاده سازی و نگهداری آن استخدام یا آموزش دهد. با توجه به ماهیت دائما در حال تغییر فنآوری، آموزش مداوم برای به حداکثر رساندن کارایی فناوریهای پایگاه داده ضروری است. |
هزینهها، پیچیدگیهای نصب و راه اندازی و مدیریت |
سیستمهای پایگاه داده چند کاربره، معماریهای نرم افزاری گسترده و پیچیدهای دارند که اغلب با هزینههای سالانه پشتیبانی فنی و توسعه همراه هستند. افزونههای نرم افزاری با بهبود مستمر در امنیت، یکی از موارد ضروری هنگام کار با داده میباشند. |
پشتیبان گیری، بازیابی و امنیت | پشتیبان گیری منظم، ثبات دادهها و دسترسی بالا را تضمین میکند. رویههای امنیتی واضح و بازیابی پایگاه داده برای یک سیستم دیتابیس مدرن امری ضروری است. |
تعارضات سازمانی | پایگاههای داده مشترک، نیاز به رضایت در مورد تعریف و مالکیت داده دارند. علاوه بر این، یک فرد متخصص برای نگهداری دادهها مورد نیاز است. بنابراین، یک مدیر پایگاه داده توانمند برای سازمان ضروری است. |
کلام آخر
پایگاه داده مجموعهای سازمان یافته از دادهها است که به راحتی قابل دسترسی و مدیریت است. میتوان دادهها را در جدولها، ردیفها، ستونها سازماندهی کرد و با فهرستبندی آن امکان پیدا کردن اطلاعات را تسهیل بخشید.
امروزه وبسایتهای زیادی در شبکه جهانی وب وجود دارد که از طریق پایگاههای داده مدیریت میشوند. امروزه، دیتابیس مدرن توسط سیستم مدیریت پایگاه داده (DBMS) مدیریت میشود که مزایای بسیاری را در اختیار سازمانهای بزرگ و کوچک قرار میدهد.
منابع:
https://www.tutorialspoint.com
بدون دیدگاه