greenplum和hadoop對比 mpp數據庫有哪些


前段時間在網上看到一張大數據行業全景圖,幾乎涵蓋了大數據相關的全部技術 。光數據庫產品就好幾十種,真是眼花繚亂:)
先說說幾個概念:結構化和非結構化數據,關系型和非關系型數據庫
簡單而言,可以用二維表來表示的就是結構化數據(如,包含有不同字段的一條記錄);相反,不方便用二維邏輯表來表現的數據,如文本、圖片、視頻、XML、HTML、圖像和音頻就是非結構化數據 。此外,字段可根據需要擴充,即字段數目不定的,可稱為半結構化數據 。
關系型數據庫就是由二維表及其之間的聯系所組成的一個數據集 ??梢赃@樣理解,如果數據集(數據庫)是關系型,那么數據一定是結構化的,相反如果數據是結構化,那么組成的數據集可能是關系型 。關系型數據庫的最大特點就是事務的一致性 。傳統的關系型數據庫讀寫操作都是事務的,具有ACID(不展開講)的特點,如典型的銀行系統 。但是,在互聯網應用中,一致性卻不是顯得那么重要:如張三看到的內容和李四看到同一內容更新不一致是可以容忍的,換句話說,兩個人看到同一好友的數據更新的時間差那么幾秒是可以容忍的 。因此,關系型數據庫的最大特點在互聯網時代已經不那么重要了 。
1、關系型數據庫
數據庫發展的早期,幾乎都是集中式的關系型數據庫的天下,如商業型數據庫ORACLE、SQL Server、IBM DB2、Syba

    猜你喜歡