Impala is the industry’s first nati

Impala is the industry’s first native real-time SQL query engine for Apache Hadoop, it is the newest component of CDH. Impala completely changes the way organizations can benefit from Hadoop. Cloudera Impala is Cloudera's open source massively parallel processing (MPP) SQL query engine for data stored in a computer cluster running Apache Hadoop. Using Impala,Data processing workload acceleration, with data pipelines will last seconds instead of minutes or hours, to meet tighter service-level agreement (SLA) specifications. It has a Interactive business intelligence with popular tools. This opens up real-time access to big data to every analyst in the organization, without requiring any special training, significantly lowering the adoption risk of a big data project and accelerating return on investment (ROI). It reduces overall cost of data management, Instead of replicating large amounts of data to a relational database to get interactive SQL performance, Cloudera customers can obtain the same experience without added cost or complexity.Impala is meant to be good at what hive is bad at i.e fast response queries and it is also meant to be good at what hive is good at. Impala brings scalable parallel database technology to Hadoop, enabling users to issue low-latency SQL queries to data stored in HDFS and Apache HBase without requiring data movement or transformation. Impala is integrated with Hadoop to use the same file and data formats, metadata, security and resource management frameworks used by MapReduce, Apache Hive, Apache Pig and other Hadoop software. Impala is used by analysts and data scientists to perform analytics on data stored in Hadoop via SQL or business intelligence tools. The result is that large-scale data processing and interactive queries can be done on the same system using the same data and metadata ± removing the need to migrate data sets into specialized systems and/or proprietary formats simply to perform analysis. Before Impala, if your relational database was at capacity, you may have had no choice but to expand that system to maintain your expectations of performance. If you were using Hadoop to affordably analyze any amount or kind of data, but wanted interactive performance, you had to move that data into a fast relational database. You then had to accept the cost and effort of duplicate storage and data synchronization; accept the rigidity of requiring fixed schemas; accept that when you moved and transformed data you would inevitably leave something behind; accept that your analysis options would be limited in that target database.With Impala, you now have a choice. As a native component of the Hadoop ecosystem, Impala combines all of the benefits of other Hadoop frameworks, including flexibility, scalability, and cost-effectiveness, with the performance, usability, and SQL functionality necessary for an enterprise-grade analytic database.Impala was specifically targeted for integration with standard business intelligence environments, and to that end supports most relevant industry standards: clients can connect via ODBC or JDBC; authentication is accomplished with Kerberos or LDAP; authorization follows the standard SQL roles and privileges.In order to query HDFS-resident data, the user creates tables via the familiar CREATE TABLE statement, which, in addition to providing the logical schema of the data, also indicates the physical layout, such as file format(s) and placement within the HDFS directory structure. Those tables can then be queried with standard SQL syntax. WORKING OF IMPALA WITH HIVE:Impala makes use of many familiar components within the Hadoop ecosystem. Impala can interchange data with other Hadoop components, as both a consumer and a producer, so it can fit in flexible ways into your ETL and ELT pipelines. A major Impala goal is to make SQL-on-Hadoop operations fast and efficient enough to appeal to new categories of users and open up Hadoop to new types of use cases. Where practical, it makes use of existing Apache Hive infrastructure that many Hadoop users already have in place to perform long-running, batch-oriented SQL queries.In particular,Impala keeps its table definitions in a traditional MySQL or PostgreSQL database known as the metastore, the same database where Hive keeps this type of data. Thus, Impala can access tables defined or loaded by Hive, as long as all columns use Impala-supported data types, file formats, and compression codecs as shown in Fig.1.The initial focus on query features and performance means that Impala can read more types of data with the 6(/(&7 statement than it can write with the ,16(57 statement. To query data using the Avro, RCFile, or SequenceFile file formats, you load the data using Hive. The Impala query optimizer can also make use of table statistics and column statistics. Originally, you gathered this information with the $1$/

0/5000

源语言: -

目标语言: -

结果 (简体中文) 1: [复制]

复制成功！

黑斑羚是Apache Hadoop的业界首款原生实时SQL查询引擎，它是CDH的最新组成部分。帕拉彻底改变企业可以从Hadoop的受益方式。Cloudera的帕拉是Cloudera的开源大规模并行处理（MPP），用于存储在运行Apache的Hadoop计算机集群数据的SQL查询引擎。使用黑斑羚，数据处理工作量加速，数据管道将持续秒而不是分钟或数小时，以满足更严格的服务水平协议（SLA）的规范。它与流行的工具互动式商业智能。这开辟了实时访问大数据到组织中的每一个分析师，而不需要任何特殊的培训，显著降低大数据项目采用风险，加快投资回报（ROI）。它减少了数据管理的总体成本，而不是复制大量数据到关系数据库中获得交互式SQL的性能，Cloudera的客户能够获得不增加成本或complexity.Impala，就是要善于蜂巢什么是坏的一样的体验即快速响应查询，这也意味着要善于蜂巢所擅长。因帕拉带来了可扩展的并行数据库技术的Hadoop，使用户能够发出低延迟SQL查询存储在HDFS和Apache HBase的数据，而无需数据移动或转换。因帕拉与Hadoop的集成使用由MapReduce的，阿帕奇蜂巢，Apache的猪和其他的Hadoop软件使用相同的文件和数据格式，元数据，安全和资源管理框架。因帕拉所使用的分析师和数据科学家进行的通过SQL或商务智能工具存储在Hadoop的数据分析。其结果是，大型数据处理和交互的查询可以在同一系统上使用相同的数据和元数据±除去需要迁移的数据集成专门系统和/或专有格式简单地执行分析来完成。帕拉之前，如果你的关系数据库是在容量，你可能已经别无选择，只能扩大这一系统，以保持你的业绩预期。如果您在使用Hadoop来分析经济实惠任何数量或类型的数据，但希望交互性能，你必须将数据移动到一个快速的关系型数据库。那么你不得不接受的成本和重复存储和数据同步的努力; 接受需要固定模式的刚性; 接受，当你移动和变换的数据，你将不可避免地留下的东西; 接受你的分析选项会在目标database.With黑斑羚是有限的，你现在有一个选择。作为Hadoop的生态系统的本机组件，黑斑羚结合了所有的其他的Hadoop框架，包括灵活性，可扩展性和成本效益的优势，与性能，可用性和SQL功能所必需的企业级分析database.Impala是专门针对与标准商业智能环境的整合，并为此支持大多数相关的行业标准：客户可以通过ODBC或JDBC连接; 认证用Kerberos或LDAP实现的; 授权遵循标准的SQL角色和privileges.In为了查询HDFS驻留数据，用户创建通过熟悉的表CREATE TABLE语句，其中，除了提供的数据的逻辑模式，也指示物理布局，诸如文件格式（或多个）和安置在HDFS目录结构中。这些表然后可以使用标准的SQL语法查询。IMPALA与HIVE工作：帕拉利用许多熟悉的组件的Hadoop生态系统中。因帕拉可以交换与其他的Hadoop组件的数据，同时作为消费者和生产者，因此它可以适应灵活的方式进入你的ETL和ELT管道。一个主要的黑斑羚的目标是使SQL-ON-Hadoop的操作快速，高效的，足以呼吁新类别的用户，开辟Hadoop的新类型的使用情况。如果可行的话，它利用现有的Apache蜂巢基础设施，很多的Hadoop用户已经到位，以执行长期运行的，面向批处理的SQL queries.In特别是黑斑羚保持在被称为metastore传统的MySQL或PostgreSQL数据库的表定义，同数据库，在那里蜂巢保持这种类型的数据。因此，帕拉罐访问表中定义或通过蜂巢装载，只要所有列使用帕拉支持的数据类型，文件格式和压缩编解码如图Fig.1.The初始焦点上的查询功能和性能的手段即帕拉可以读取多种类型的与6（/（＆比它可以使用所述阿夫罗，RCFile，或SequenceFile文件格式，16（57语句。为了查询数据写7语句，则加载使用蜂房的数据，帕拉查询优化器可以数据的还利用表统计信息和列统计信息。

正在翻译中..

结果 (简体中文) 2:[复制]

复制成功！

Impala 是业界首款针对 Apache Hadoop 的本机实时 SQL 查询引擎，是 CDH 的最新组件。Impala 彻底改变了组织从 Hadoop 中获益的方式。Cloudera Impala 是 Cloudera 的开源大规模并行处理（MPP） SQL 查询引擎，用于存储在运行 Apache Hadoop 的计算机群集中的数据。使用 Impala，数据处理工作负载加速，数据管道将持续几秒钟，而不是几分钟或几小时，以满足更严格的服务级别协议（SLA）规范。它有一个互动的商业智能与流行的工具。这为组织中的每个分析师提供实时访问大数据的机会，无需任何特殊培训，从而大大降低了大数据项目的采用风险并加快了投资回报（ROI）。它降低了数据管理的总体成本，而不是将大量数据复制到关系数据库以获得交互式 SQL 性能，Cloudera 客户无需增加成本或复杂性即可获得相同的体验。Impala 是要擅长什么是蜂巢是坏的，即快速响应查询，它也意味着擅长什么蜂巢是擅长的。Impala 为 Hadoop 带来了可扩展的并行数据库技术，使用户能够向存储在 HDFS 和 Apache HBase 中的数据发出低延迟 SQL 查询，而无需数据移动或转换。Impala 与 Hadoop 集成，以使用相同的文件和数据格式、元数据、安全和资源管理框架，这些框架由 MapReduce、Apache Hive、Apache Pig 和其他 Hadoop 软件使用。分析师和数据科学家使用 Impala 对通过 SQL 或商业智能工具存储在 Hadoop 中的数据进行分析。结果是，可以使用相同的数据和元数据在同一系统上执行大规模数据处理和交互式查询，无需将数据集迁移到专用系统和/或专有格式，即可执行分析。在 Impala 之前，如果关系数据库已处于容量，您可能别无选择，只能扩展该系统以保持您对性能的期望。如果您使用 Hadoop 以经济方式分析任何数量或类型的数据，但希望获得交互性能，则必须将数据移动到快速关系数据库中。然后，您必须接受重复存储和数据同步的成本和工作量;接受要求固定架构的刚性;接受，当你移动和转换数据，你不可避免地会留下的东西;接受您的分析选项将限制在目标数据库中。有了Impala，你现在有了选择。作为 Hadoop 生态系统的本机组件，Impala 将其他 Hadoop 框架的所有优势（包括灵活性、可扩展性和成本效益）与企业级分析数据库所需的性能、可用性和 SQL 功能相结合。Impala 是专门与标准商业智能环境集成的目标，为此支持最相关的行业标准：客户可以通过 ODBC 或 JDBC 进行连接;使用 Kerberos 或 LDAP 完成身份验证;授权遵循标准 SQL 角色和权限。为了查询 HDFS 驻留数据，用户通过熟悉的 CREATE TABLE 语句创建表，该语句除了提供数据的逻辑架构外，还指示物理布局，如文件格式和 HDFS 目录结构中的放置。然后可以使用标准 SQL 语法查询这些表。与HIVE的IMPALA工作：Impala利用Hadoop生态系统中的许多熟悉的组件。Impala 可以作为使用者和生产者与其他 Hadoop 组件交换数据，因此它可以以灵活的方式融入您的 ETL 和 ELT 管道。Impala 的一个主要目标是使 Hadoop 上的 SQL 操作快速且高效，以吸引新类别的用户，并使 Hadoop 能够适应新类型的用例。在可行的情况下，它利用许多 Hadoop 用户已经具备的现有 Apache Hive 基础结构来执行长时间运行的、面向批处理的 SQL 查询。特别是，Impala 将其表定义保存在称为元存储的传统 MySQL 或 PostgreSQL 数据库中，该数据库是 Hive 保存此类数据的相同数据库。因此，Impala 可以访问由 Hive 定义或加载的表，只要所有列都使用图 1 所示的 Impala 支持的数据类型、文件格式和压缩编解码器。要使用 Avro、RCFile 或 SequenceFile 文件格式查询数据，请使用 Hive 加载数据。Impala 查询优化器还可以使用表统计信息和列统计信息。最初，您收集了此信息与 $1$/

正在翻译中..

结果 (简体中文) 3:[复制]

复制成功！

Impala是业界第一个针对Apache Hadoop的本地实时SQL查询引擎，它是CDH的最新组件。Impala完全改变了组织从Hadoop中获益的方式。Cloudera Impala是Cloudera的开源大规模并行处理（MPP）SQL查询引擎，用于存储在运行Apache Hadoop的计算机集群中的数据。使用Impala，数据处理工作负载加速（使用数据管道）将持续数秒而不是数分钟或数小时，以满足更严格的服务级别协议（SLA）规范。它具有与流行工具交互的商业智能。这为组织中的每个分析师提供了实时访问大数据的机会，无需任何特殊培训，大大降低了大数据项目的采用风险，并加快了投资回报率（ROI）。它降低了数据管理的总体成本，而不是将大量数据复制到关系数据库中以获得交互式SQL性能，Cloudera客户可以获得相同的体验而不增加成本或复杂性。IMPLA意味着擅长蜂箱是坏的，即快速响应查询，并且它也意味着擅长于什么。蜂巢擅长。Impala将可伸缩的并行数据库技术引入Hadoop，使用户能够向HDFS和Apache HBase中存储的数据发出低延迟SQL查询，而无需移动或转换数据。Impala与Hadoop集成，使用MapReduce、Apache Hive、Apache Pig和其他Hadoop软件使用的相同文件和数据格式、元数据、安全和资源管理框架。Impala被分析师和数据科学家用来通过SQL或商业智能工具对存储在Hadoop中的数据进行分析。结果是，可以使用相同的数据和元数据在同一个系统上进行大规模数据处理和交互式查询，从而消除了将数据集迁移到专门系统和/或专有格式中进行分析的需要。在Impala出现之前，如果您的关系数据库处于可用状态，您可能别无选择，只能扩展该系统以保持您对性能的期望。如果您使用Hadoop来经济地分析任何数量或类型的数据，但需要交互性能，那么您必须将该数据移动到一个快速的关系数据库中。然后，您必须接受重复存储和数据同步的成本和工作量；接受要求固定模式的刚性；接受在移动和转换数据时不可避免地会留下一些东西；接受分析选项在目标数据库中将受到限制。使用Impala，您现在有了一个选择。作为Hadoop生态系统的原生组件，IMPLA结合了其他Hadoop框架的所有优点，包括灵活性、可扩展性和成本效益，以及企业级分析数据库所必需的性能、可用性和SQL功能。智能环境，并为此目的支持最相关的行业标准：客户端可以通过ODBC或JDBC连接；身份验证通过Kerberos或LDAP完成；授权遵循标准的SQL角色和权限。为了查询HDFS驻留数据，用户通过熟悉的CREATE TABLE语句创建表，该语句，除了提供数据的逻辑模式外，还指示物理布局，例如文件格式和HDFS目录结构中的位置。然后可以使用标准SQL语法查询这些表。IMPALA与HIVE的协作：IMPALA使用了Hadoop生态系统中许多熟悉的组件。黑斑羚可以与其他Hadoop组件交换数据，既可以是消费者也可以是生产者，因此它可以以灵活的方式适应您的ETL和教学管道。Impala的一个主要目标是使Hadoop上的SQL操作足够快速和高效，以吸引新类别的用户，并向新类型的用例开放Hadoop。在实用的情况下，它使用了许多Hadoop用户已经存在的现有Apache蜂巢基础设施来执行长时间运行的面向批处理的SQL查询。特别是，IMPLA将其表定义保存在传统的MySQL或PostgreSQL数据库中，称为AsdiRoE，即Hiver保持这种类型数据的相同数据库。因此，Impala可以访问由Hive定义或加载的表，只要所有列都使用Impala支持的数据类型、文件格式和压缩编解码器，如图1所示。最初对查询功能和性能的关注意味着，Impala可以使用6（/（&7）语句读取更多类型的数据，而不是使用，16（57）语句。要使用Avro、RCFile或SequenceFile文件格式查询数据，可以使用配置单元加载数据。Impala查询优化器还可以使用表统计信息和列统计信息。最初，你用1美元收集了这些信息$/<br>

正在翻译中..

其它语言

本翻译工具支持: 世界语, 丹麦语, 乌克兰语, 乌兹别克语, 乌尔都语, 亚美尼亚语, 伊博语, 俄语, 保加利亚语, 信德语, 修纳语, 僧伽罗语, 克林贡语, 克罗地亚语, 冰岛语, 加利西亚语, 加泰罗尼亚语, 匈牙利语, 南非祖鲁语, 南非科萨语, 卡纳达语, 卢旺达语, 卢森堡语, 印地语, 印尼巽他语, 印尼爪哇语, 印尼语, 古吉拉特语, 吉尔吉斯语, 哈萨克语, 土库曼语, 土耳其语, 塔吉克语, 塞尔维亚语, 塞索托语, 夏威夷语, 奥利亚语, 威尔士语, 孟加拉语, 宿务语, 尼泊尔语, 巴斯克语, 布尔语(南非荷兰语), 希伯来语, 希腊语, 库尔德语, 弗里西语, 德语, 意大利语, 意第绪语, 拉丁语, 拉脱维亚语, 挪威语, 捷克语, 斯洛伐克语, 斯洛文尼亚语, 斯瓦希里语, 旁遮普语, 日语, 普什图语, 格鲁吉亚语, 毛利语, 法语, 波兰语, 波斯尼亚语, 波斯语, 泰卢固语, 泰米尔语, 泰语, 海地克里奥尔语, 爱尔兰语, 爱沙尼亚语, 瑞典语, 白俄罗斯语, 科西嘉语, 立陶宛语, 简体中文, 索马里语, 繁体中文, 约鲁巴语, 维吾尔语, 缅甸语, 罗马尼亚语, 老挝语, 自动识别, 芬兰语, 苏格兰盖尔语, 苗语, 英语, 荷兰语, 菲律宾语, 萨摩亚语, 葡萄牙语, 蒙古语, 西班牙语, 豪萨语, 越南语, 阿塞拜疆语, 阿姆哈拉语, 阿尔巴尼亚语, 阿拉伯语, 鞑靼语, 韩语, 马其顿语, 马尔加什语, 马拉地语, 马拉雅拉姆语, 马来语, 马耳他语, 高棉语, 齐切瓦语, 等语言的翻译.