当前位置:首页 » 服务器技术
开发技术指南» 文章正文
    引言: 数据清洁 如果你有一个数据集是不“干净”的,例如它没有被标准化,SSIS有一系列的工具集可以用来清洁和标准化数据。
 

 

    摘要:一、简介 可扩展标记语言 (xml) 作为一种与平台无关的数据表示形式已被广泛采用。它对于在松散耦合且完全不同的系统,以及各种企业到企业 (b2b) 应用和工作流范畴内交换信息是很有用的。数据交换已成为 xml 技术的主要驱动力之一。. xml 在企业应用程序中的使用正日益广泛,它主要用于对半结构化和非结构化数据进行建模。文档管理就是这样的一种应用程序。像电子邮件这样的文档是半结构化性质的。如果文档以 xml 的形式存储在数据库服务器中,就可以开发功......
    摘要:1.打开 dts 设计器。 2.创建一个新的 etl 项目,添加一个新包,单击 data flow 选项卡,然后接受 add a data flow 项选项。 3.在数据流图上,从 toolbox 拖动 ole db 源和目标转换,然后通过使用一个模糊查找的实例连接它们。 4.通过选择一个连接和包含有问题的数据的输入表,将 ole db 源指向您的新数据。 您的数据必须包含一些字符串列。 5.双击 fuzzy lookup 打开自定义用户界......


SQL Server集成服务编程基础

如果你曾经将数据从sql server中移入或者移出,那么你现在就可以使用微软的dts或者微软的数据传输服务工具来完成了。dts是一个etl(是抽取、传输与载入的缩写)的工具,它可以让数据库管理员们创建一系列步骤来描述数据是如何被传输的。这些“包”,正如它们的名字,是可以通过一些不同的程序语言或者直接在sql 服务器自身运行的。

这个想法一直以来都是一个不错的想法,但是无论如何还是有局限的——如果使用早期版本的sql server的块拷贝系统的版本很方便的话,它还是能够继续荣耀下去的。在sql server2005上,微软决定将dts变成一种全新的etl工具——sql server综合服务(ssis)。将数据从一个数据库移动到另外一个数据库上或者是以另外一种格式导出数据库,是你可以使用的ssis的最基本的用途。这里是一些使用ssis的一些其他原因:

如果你有一个数据集是不“干净”的,例如它没有被标准化,ssis有一系列的工具集可以用来清洁与标准化数据。其中包括类似“模糊”匹配与分组的函数,那么那些看起来是一样的数据(只是经过了不同的导入与导出)就可以被过滤掉并标准化。有关这一点的一个很好的例子就是来自不同地理区域的拥有不同种类的数据:同样的想法也可以通过不同的方式来表达,它们在被处理之前需要被标准化。 【相关文章:虚拟化厂商碰撞 LinuxWorld上的

数据清洁 【扩展阅读:虚拟化是Unix竞争焦点

你可以使用ssis将数据直接通过管道连接到立方体上,以便于数据挖掘。除了将这些数据导入本地数据库,然后在那里进行挖掘之外,ssis包自身也可以用于数据源。 【扩展信息:微软、VMWare加入Mac虚拟化战局

连接到分析服务立方体上

与sql server报告服务整合

对于分析立方体,ssis包还可以直接用于数据源来创建报告。

完全的.net报告

这或许是假设的,但是ssis编程的确可以在本地或者通过com对象接口在任何一种.net语言中完成——或者,实际上,任何支持com对象的语言。


...   下一页
    摘要:一、简介 由于拼写错误、截断、缺少或插入的标记、空字段、意外的缩略语和其他不规则问题,实际的数据是“有问题”的。 因此,在数据仓库项目中,很大一部分的时间和金钱都花费在了提取、转换和加载 (etl) 阶段。 在 etl 阶段,新数据被清理、标准化,并使其与现有数据一致。 在 microsoft sql server?2005 中可用的模糊查找和模糊分组转换,有助于使 etl 过程在遇到若干种在实际数据中观测到的常见错误时更易复原。 它们解决一般的匹配和......
» 本期热门文章:

©2000-2007 All Rights Reserved. 最佳浏览:1024X768 MSIE