Paul Grabscheid是InterSystems公司战略规划部门副总裁他一直在思考数据库的未来方向本文由DDJ记者对话Paul Grabscheid先生(简称PG)看他是怎么回答的
记者InterSystems同时提供了面向普通目的和医疗保健业的数据库产品医疗保健业需要什么特殊的数据库呢?
PG虽然InterSystems的Cache数据库在医疗保健业得到了广泛使用它吸引人的特性使得在其它领域也受到越来多的重视首先临床方面要处理大量的非结构化和半结构化数据医疗记录中的数据和收集数据的格式与普通数据是完全不一样的存储方式也在不断发展所有这一切都要求对象模型要具有内在的灵活性既要捕捉到丰富的数据存储也要有效地支持才行也要使用新的数据类型例如目前越来越多的基因组信息被捕获用来诊断和治疗医疗保健的另一个挑战是要让数据模型看起来更优美临床数据数年后仍然有价值而不象其它领域那样可能在几周内或几个月内有价值这就需要增加新的数据新的数据类型和新的关系并且不能破坏现有应用程序和结构以及数据库重组或卸载/重新加载周期对象数据库技术有助于通过模式演化使增量无损更改数据库结构成为可能并通过对象概念的多态性为不同的对象类型或版本提供安全的访问
记者在对象/关系领域总是要预防不匹配的问题
PG我认为预防不匹配变得越来越重要十多年前对象的概念被强化了但学习起来很困难这些概念都来自于国外专注于文件和数据库开发的开发商相比传统的方法开发一套基于对象的应用程序需要更多的步骤和工作时至今日情况正好相反许多(甚至大多数)开发商都在思考它们正在尝试解决的问题以及它们用来解决问题的数据模型对象概念中的继承封装和多态性已经成为方案框架和构建应用的天然方式目前在后端使用关系来存储反倒增加了额外的开发步骤因为需要实现对象关系之间的映射
在设计时就要完成从关系到对象数据模型的转换而不是在编码或执行时才进行转换因为应用程序数据模型变得越来越复杂富对象模型的优点是它天生就表现了双向关系控制和分层数据库中的对象模型减小了开发成本相比关系数据库中使用多个JOIN而言它显着地降低了运行时的开销
记者我们通常熟悉的是事务数据库但什么是事务位图索引呢?
PG传统上用于事务处理和分析的数据往往是分开的分析通常会建立数据仓库这种分离机制使业务系统的性能和安全性都有所提升大多数数据仓库主要是用于分析长期的数据并不需要最新的精确到分钟的数据通常一周或一个月从业务系统数据库往数据仓库更新一次数据就已经足够了位图索引是数据仓库最佳的方法它为复杂查询提供了优秀的性能即使在insertupdate和delete操作时性能相对降低了但也不会对事务系统产生恶劣影响皆大欢喜
现在焦点已经转向利用商务智能和其他分析技术作为应用程序的一部分以便支持范围更广的每日决策需要为了满足这种需求我们已经开始以一种新的方法运行位图索引既满足高性能查询又满足高性能更新从技术上来看使用压缩技术替换简单的每行一位的存储技术使存储效果更有效更理想在数据库引擎中以更优秀的方法处理位图这种事务位图索引技术引发了实时分析开发的新浪潮
记者数据库即服务是一个新兴主题特别是云计算对于开发者而言这意味着什么?对于数据库厂商这又意味着什么?
PG我不确定数据库即服务会成为一个成功的商业概念因为目前的趋势是花钱购买某种应用程序服务我所接触过的客户对架构即服务没什么兴趣数据库即服务要求系统管理简单但目前在企业级数据库软件上还看不到这一点还需要能够透明地增加或移除系统功能应用不能中断在这些领取的改进将有助于降低操作成本并提升整个系统的可用性