一、數據庫和數據庫管理系統的關系
數據庫管理系統(Database Management System,DBMS)是指用于管理數據庫的軟件系統,負責實現數據庫中數據的組織、儲存、查詢、修改和刪除等基本操作。數據庫管理系統是數據庫系統的核心組成部分,它是介于用戶與操作系統之間的一層數據管理軟件,是用戶和數據庫的接口,用于協調和管理數據庫中的數據和操作。而數據庫是數據庫管理系統的主要對象。
二、數據庫與數據庫系統的關系
數據庫系統(Database System)則是指數據庫及其管理軟件,同時還涉及到一些與數據庫相關的硬件、網絡、安全等方面的技術,是一個更加全面的概念。數據庫系統是由數據庫、數據庫管理系統和相應的應用程序組成的。數據庫系統是實現應用程序和數據之間交互和數據的存儲、管理、維護、保護等的一個整體系統。數據庫是在數據庫系統中使用的數據集合。
三、數據庫介紹
1、定義
數據庫是存放數據的倉庫。它的存儲空間很大,可以存放百萬條、千萬條、上億條數據。但是數據庫并不是隨意地將數據進行存放,是有一定的規則的,否則查詢的效率會很低。當今世界是一個充滿著數據的互聯網世界,充斥著大量的數據。即這個互聯網世界就是數據世界。數據的來源有很多,比如出行記錄、消費記錄、瀏覽的網頁、發送的消息等等。除了文本類型的數據,圖像、音樂、聲音都是數據。
數據庫是一個按數據結構來存儲和管理數據的計算機軟件系統。數據庫的概念實際包括兩層意思:
數據庫是一個實體,它是能夠合理保管數據的“倉庫”,用戶在該“倉庫”中存放要管理的事務數據,“數據”和“庫”兩個概念結合成為數據庫。數據庫是數據管理的新方法和技術,它能更合適的組織數據、更方便的維護數據、更嚴密的控制數據和更有效的利用數據。數據庫作為最重要的基礎軟件,是確保計算機系統穩定運行的基石。
2、發展現狀
在數據庫的發展歷史上,數據庫先后經歷了層次數據庫、網狀數據庫和關系數據庫等各個階段的發展,數據庫技術在各個方面的快速的發展。特別是關系型數據庫已經成為目前數據庫產品中最重要的一員,80年代以來, 幾乎所有的數據庫廠商新出的數據庫產品都支持關系型數據庫,即使一些非關系數據庫產品也幾乎都有支持關系數據庫的接口。這主要是傳統的關系型數據庫可以比較好的解決管理和存儲關系型數據的問題。隨著云計算的發展和大數據時代的到來,關系型數據庫越來越無法滿足需要,這主要是由于越來越多的半關系型和非關系型數據需要用數據庫進行存儲管理,以此同時,分布式技術等新技術的出現也對數據庫的技術提出了新的要求,于是越來越多的非關系型數據庫就開始出現,這類數據庫與傳統的關系型數據庫在設計和數據結構有了很大的不同, 它們更強調數據庫數據的高并發讀寫和存儲大數據,這類數據庫一般被稱為NoSQL(Not only SQL)數據庫。 而傳統的關系型數據庫在一些傳統領域依然保持了強大的生命力。
3、數據庫管理系統
數據庫管理系統是為管理數據庫而設計的電腦軟件系統,一般具有存儲、截取、安全保障、備份等基礎功能。數據庫管理系統可以依據它所支持的數據庫模型來作分類,例如關系式、XML;或依據所支持的計算機類型來作分類,例如服務器群集、移動電話;或依據所用查詢語言來作分類,例如SQL、XQuery;或依據性能沖量重點來作分類,例如最大規模、較高運行速度;亦或其他的分類方式。不論使用哪種分類方式,一些DBMS能夠跨類別,例如,同時支持多種查詢語言。?
數據庫管理系統是數據庫系統的核心組成部分,主要完成對數據庫的操作與管理功能,實現數據庫對象的創建、數據庫存儲數據的查詢、添加、修改與刪除操作和數據庫的用戶管理、權限管理等。它的安全直接關系到整個數據庫系統的安全,其防護手段主要有:
使用正版數據庫管理系統并及時安裝相關補丁。做好用戶賬戶管理,禁用默認超級管理員賬戶或者為超級管理員賬戶設置復雜密碼;為應用程序分別分配專用賬戶進行訪問;設置用戶登錄時間及登錄失敗次數限制, 防止暴力破解用戶密碼。分配用戶訪問權限時,堅持最小權限分配原則,并限制用戶只能訪問特定數據庫,不能同時訪問其他數據庫。修改數據庫默認訪問端口,使用防火墻屏蔽掉對 外開放的其他端口,禁止一切外部的端口探測行為。對數據庫內存儲的重要數據、敏感數據進行加密存儲,防止數據庫備份或數據文件被盜而造成數據泄露。設置好數據庫的備份策略,保證數據庫被破壞后能迅速恢復。對數據庫內的系統存儲過程進行合理管理,禁用掉不必要的存儲過程,防止利用存儲過程進行數據庫探測與攻擊。啟用數據庫審核功能,對數據庫進行全面的事件跟蹤和日志記錄。4、關系型數據庫
關系型數據庫,存儲的格式可以直觀地反映實體間的關系。關系型數據庫和常見的表格比較相似,關系型數據庫中表與表之間是有很多復雜的關聯關系的。 常見的關系型數據庫有Mysql,SqlServer等。在輕量或者小型的應用中,使用不同的關系型數據庫對系統的性能影響不大,但是在構建大型應用時,則需要根據應用的業務需求和性能需求,選擇合適的關系型數據庫。
5、非關系型數據庫(NoSQL)
隨著近些年技術方向的不斷拓展,大量的NoSql數據庫如MongoDB、Redis、Memcache出于簡化數據庫結構、避免冗余、影響性能的表連接、摒棄復雜分布式的目的被設計。
指的是分布式的、非關系型的、不保證遵循ACID原則的數據存儲系統。NoSQL數據庫技術與CAP理論、一致性哈希算法有密切關系。所謂CAP理論,簡單來說就是一個分布式系統不可能滿足可用性、一致性與分區容錯性這三個要求,一次性滿足兩種要求是該系統的上限。而一致性哈希算法則指的是NoSQL數據庫在應用過程中,為滿足工作需求而在通常情況下產生的一種數據算法,該算法能有效解決工作方面的諸多問題但也存在弊端,即工作完成質量會隨著節點的變化而產生波動,當節點過多時,相關工作結果就無法那么準確。這一問題使整個系統的工作效率受到影響,導致整個數據庫系統的數據亂碼與出錯率大大提高,甚至會出現數據節點的內容遷移,產生錯誤的代碼信息。但盡管如此,NoSQL數據庫技術還是具有非常明顯的應用優勢,如數據庫結構相對簡單,在大數據量下的讀寫性能好;能滿足隨時存儲自定義數據格式需求,非常適用于大數據處理工作。
NoSQL數據庫適合追求速度和可擴展性、業務多變的應用場景。對于非結構化數據的處理更合適,如文章、評論,這些數據如全文搜索、機器學習通常只用于模糊處理,并不需要像結構化數據一樣,進行精確查詢,而且這類數據的數據規模往往是海量的,數據規模的增長往往也是不可能預期的,而NoSQL數據庫的擴展能力幾乎也是無限的,所以NoSQL數據庫可以很好的滿足這一類數據的存儲。NoSQL數據庫利用key-value可以大量的獲取大量的非結構化數據,并且數據的獲取效率很高,但用它查詢結構化數據效果就比較差。
延伸閱讀1:分布式數據庫
所謂的分布式數據庫技術,就是結合了數據庫技術與分布式技術的一種結合。具體指的是把那些在地理意義上分散開的各個數據庫節點,但在計算機系統邏輯上又是屬于同一個系統的數據結合起來的一種數據庫技術。既有著數據庫間的協調性也有著數據的分布性。這個系統并不注重系統的集中控制,而是注重每個數據庫節點的自治性,此外為了讓程序員能夠在編寫程序時可以減輕工作量以及系統出錯的可能性,一般都是完全不考慮數據的分布情況,這樣的結果就使得系統數據的分布情況一直保持著透明性。