Since class overlap has not been ma

Since class overlap has not been mathematically well characterised[35], a standard measurement of the overlap degreeis not yet defined. Several approaches have been formulatedto estimate the overlap degree, however, with limitations. Forexample, in [17], the overlap degree of a synthetic dataset wasdetermined from the overlapping area with respect to the totaldata space. In [34], the authors adapted such measurement sothat class imbalance was also taken into account seeing that theminority class is relatively more overwhelmed by class overlap.The overlap degree was instead measured from the overlappingarea with respect to the total area of the positive class.Another common approach is using the classification error asthe estimated overlap degree, e.g., the percentage of instancesmisclassified by the k-Nearest Neighbour rule [36] (kNN) withrespect to the number of total instances [37,38]. However, in [35],the authors showed that such an approach was inaccurate andproposed the use of the ridge curves of the probabilistic densityfunction to quantify class overlap. The computation was basedon the ratio of the saddle point to a smaller peak of the ridgecurves of the two classes. This method is one of a few existingmethods that measure overlap from the actual contour of dataand can be extended to handle multi-class datasets. The maindrawback of this approach is that it is only applicable to datasetswith normal distributions of both data and features, which isimpracticable to real-world datasets. In [39], the overlap degreewas defined as the distance between the class centroids, which islikely to be inaccurate due to arbitrary shapes and non-uniformityof data in nature. Another approach [40] was based on SupportVector Data Description (SVDD) [41]. SVDD was used to locateapproximated boundaries of each class in binary-class datasets,and the overlapping region was estimated based on the amountof the common instances found within both boundaries. Similarto the approach of [39], this method tends to introduce higherrors in the overlap approximation since SVDD is only capable ofdiscovering a spherical-shaped boundary of a class, which is notideal for real-world datasets.

0/5000

源语言: -

目标语言: -

结果 (简体中文) 1: [复制]

复制成功！

由于类重叠尚未在数学上得到很好的表征 [35]， 因此尚未定义重叠度的标准度量。已经制定 了几种方法来估计重叠度，但是有局限性。对于 例如，在[17]，合成数据集的重叠程度 从重叠面积确定相对于总的 数据空间。在 [34] 中，作者调整了这种测量方法，以便 也考虑到类不平衡，因为 少数类相对更多地被类重叠所淹没。 重叠度是从重叠 面积相对于阳性类的总面积来衡量的。 另一种常见的方法是使用分类误差作为 估计的重叠度，例如， 由 k-最近邻规则 [36] (kNN) 错误分类的实例 相对于总实例数 [37,38]的百分比。然而，在 [35] 中， 作者表明这种方法是不准确的，并 提出使用概率密度 函数的脊曲线来量化类重叠。计算基于 鞍点 与两个类别的脊曲线的较小峰值的比率。该方法是现有的 几种方法之一，可以测量数据实际轮廓的重叠， 并且可以扩展到处理多类数据集。主要的 这种方法的缺点是它只适用于 数据和特征均呈正态分布的数据集，这 对现实世界的数据集是不切实际的。在[39]中，重叠度 被定义为类质心之间的距离， 由于任意形状和 自然界数据的不均匀性，这很可能是不准确的。另一种方法 [40] 是基于支持 向量数据描述 (SVDD) [41]。SVDD 用于定位 二进制类数据集中每个类的近似边界， 并根据 在两个边界内发现的共同实例的数量估计重叠区域。类似于 [39] 的方法，这种方法倾向于引入高 重叠近似中的错误，因为 SVDD 只能 发现类的球形边界，这 对于现实世界的数据集来说并不理想。

正在翻译中..

结果 (简体中文) 2:[复制]

复制成功！

因为类重叠在数学上没有得到很好的描述 [35]，重叠度的标准度量 尚未定义。已经制定了几种方法 但是，要估计重叠程度，有一定的局限性。对于 例如，在[17]中，合成数据集的重叠度为 根据总面积的重叠面积确定 数据空间。在[34]中，作者采用了这样的测量方法 这种阶级不平衡也被考虑在内，因为 少数民族阶级相对来说更容易被阶级重叠所压倒。 相反，重叠程度是从重叠处测量的 相对于正类总面积的面积。 另一种常见的方法是使用分类错误作为 估计的重叠程度，例如实例的百分比 被k-最近邻规则[36]（kNN）错误分类 关于实例总数[37,38]。然而，在[35]中， 作者指出，这种方法是不准确的，而且是错误的 提出了利用岭曲线的概率密度 函数来量化类重叠。计算是基于 关于鞍点与山脊较小峰值之比 两类曲线。这种方法是现有的几种方法之一 从数据的实际轮廓测量重叠的方法 并且可以扩展到处理多类数据集。主要 这种方法的缺点是它只适用于数据集 具有数据和特征的正态分布 不适用于真实世界的数据集。在[39]中，重叠度 定义为类质心之间的距离，即 由于任意形状和不均匀性，可能不准确 数据在自然界中的分布。另一种方法[40]基于支持 矢量数据描述（SVDD）[41]。SVDD用于定位 二进制类数据集中每个类的近似边界， 并在此基础上对重叠区域进行了估计 在两个边界内找到的常见实例的。相像的 对于[39]中的方法，该方法倾向于引入较高的 重叠近似中的错误，因为SVDD只能 发现类的球形边界，这不是 非常适合于真实世界的数据集。

正在翻译中..

结果 (简体中文) 3:[复制]

复制成功！

因为类重叠没有被很好地数学描述[35]，重叠度的标准测量尚未定义。已经制定了几种方法然而，要估计重叠程度，有一定的局限性。为例如，在[17]中，合成数据集的重叠度为从相对于总数的重叠区域确定数据空间。在[34]中，作者调整了这样的测量阶级不平衡也被考虑在内，因为相对来说，少数民族阶层更容易被阶层重叠所淹没。相反，重叠度是根据重叠来测量的面积相对于正类的总面积。另一种常见的方法是使用分类错误作为估计的重叠程度，例如实例的百分比用k-最近邻规则[36] (kNN)错误分类关于实例总数[37，38]。然而，在[35]中，作者表明这种方法是不准确的建议使用概率密度的脊线曲线量化类重叠的函数。计算是基于关于鞍点与脊的较小峰的比率两类曲线。这是现有的少数几种方法之一从数据的实际轮廓测量重叠的方法并且可以扩展到处理多类数据集。主要的这种方法的缺点是它只适用于数据集数据和特征的正态分布对于现实世界的数据集来说是不切实际的。在[39]中，重叠度被定义为类质心之间的距离可能由于任意形状和不均匀性而不准确自然中的数据。另一种方法[40]是基于支持矢量数据描述(SVDD) [41]。SVDD被用来定位二进制类数据集中每个类的近似边界，并且基于该量来估计重叠区域在两个边界内发现的常见实例。类似的对于[39]的方法，这种方法倾向于引入高重叠近似中的误差，因为SVDD只能发现一个类的球形边界，它不是非常适合真实世界的数据集。

正在翻译中..

其它语言

本翻译工具支持: 世界语, 丹麦语, 乌克兰语, 乌兹别克语, 乌尔都语, 亚美尼亚语, 伊博语, 俄语, 保加利亚语, 信德语, 修纳语, 僧伽罗语, 克林贡语, 克罗地亚语, 冰岛语, 加利西亚语, 加泰罗尼亚语, 匈牙利语, 南非祖鲁语, 南非科萨语, 卡纳达语, 卢旺达语, 卢森堡语, 印地语, 印尼巽他语, 印尼爪哇语, 印尼语, 古吉拉特语, 吉尔吉斯语, 哈萨克语, 土库曼语, 土耳其语, 塔吉克语, 塞尔维亚语, 塞索托语, 夏威夷语, 奥利亚语, 威尔士语, 孟加拉语, 宿务语, 尼泊尔语, 巴斯克语, 布尔语(南非荷兰语), 希伯来语, 希腊语, 库尔德语, 弗里西语, 德语, 意大利语, 意第绪语, 拉丁语, 拉脱维亚语, 挪威语, 捷克语, 斯洛伐克语, 斯洛文尼亚语, 斯瓦希里语, 旁遮普语, 日语, 普什图语, 格鲁吉亚语, 毛利语, 法语, 波兰语, 波斯尼亚语, 波斯语, 泰卢固语, 泰米尔语, 泰语, 海地克里奥尔语, 爱尔兰语, 爱沙尼亚语, 瑞典语, 白俄罗斯语, 科西嘉语, 立陶宛语, 简体中文, 索马里语, 繁体中文, 约鲁巴语, 维吾尔语, 缅甸语, 罗马尼亚语, 老挝语, 自动识别, 芬兰语, 苏格兰盖尔语, 苗语, 英语, 荷兰语, 菲律宾语, 萨摩亚语, 葡萄牙语, 蒙古语, 西班牙语, 豪萨语, 越南语, 阿塞拜疆语, 阿姆哈拉语, 阿尔巴尼亚语, 阿拉伯语, 鞑靼语, 韩语, 马其顿语, 马尔加什语, 马拉地语, 马拉雅拉姆语, 马来语, 马耳他语, 高棉语, 齐切瓦语, 等语言的翻译.