面向向量部件的指数和对数函数优化方法-学术咨询网
计算机工程与科学杂志

计算机工程与科学杂志

  • 北大期刊
  • CSCD
  • 统计源期刊
  • 知网收录
  • 维普收录
  • 万方收录
基本信息
  • 主管单位:

    国防科技大学

  • 主办单位:

    国防科技大学计算机学院

  • 国际刊号:

    1007-130X

  • 国内刊号:

    43-1258/TP

  • 创刊时间:

    1973

  • 期刊类别:

    计算机期刊

  • 出版社:

    计算机工程与科学

  • 主编:

    信息科技

  • 发行周期:

    月刊

出版信息
  • 审稿周期:

    1-3个月

  • 被引次数:

    95955次

  • 邮发代号:

    42-153

  • 全年定价:

  • 他引率:

    湖南省长沙市

  • 邮编:

    410073

  • 影响因子:2.134
  • 期刊分类:北大图书馆收录期刊
  • 发文量:11131篇
  • h指数:1.215
  • 立即指数:2360104次
  • 引用半衰期:
    该刊被以下数据库收录:INSPEC 科学文摘(英)(2025)JST 日本科学技术振兴机构数据库(日)(2025)CSCD 中国科学引文数据库来源期刊(2023-2024年度)(扩展版)WJCI 科技期刊世界影响力指数报告(2024)来源期刊
    北京大学《中文核心期刊要目总览》来源期刊:2008年版,2011年版,2014年版,2017年版,2020年版,2023年版
    期刊荣誉:Caj-cd规范获奖期刊;
期刊详情 投稿咨询 关注公众号

面向向量部件的指数和对数函数优化方法

作者:沈洁,龙标,黄春,唐滔,彭林 ——本站更新时间::2025-04-20
摘要:指数和对数函数是浮点计算中重要的超越函数,在不同应用领域使用广泛。现代处理器向量寄存器宽度呈现逐代增加的趋势,为了进一步提高上层应用对向量部件的利用率,研究向量

指数和对数函数是浮点计算中重要的超越函数,在不同应用领域使用广泛。现代处理器向量寄存器宽度呈现逐代增加的趋势,为了进一步提高上层应用对向量部件的利用率,研究向量指数和对数函数优化方法具有重要的科学价值和现实意义。针对现有向量函数实现的性能瓶颈,设计和实现了面向向量部件的指数和对数函数优化方法,包括基于硬件加速指令的向量查表优化、分支优化和精度性能取舍优化。模拟器上的实验表明,优化实现的向量指数和对数函数均达到业界高精度标准,函数性能优于当前最佳开源实现,加速比达1.44以上。真实应用测试进一步表明,应用程序在优化的向量函数支持下可以实现高效向量化,相比原始标量实现平均性能提升达2.53倍。


Exponential and logarithmic functions are important transcendental functions in floating-point computation, widely used in various application fields. Modern processors exhibit a trend of increasing vector register width with each generation. To further enhance the utilization of vector units by upper-layer applications, researching optimization methods for vector exponential and logarithmic functions holds significant scientific value and practical importance. Addressing the performance bottlenecks of existing vector function implementations, this paper has  designed and implemented optimization methods for exponential and logarithmic functions tailored for vector units. These methods include vector lookup table optimization based on hardware acceleration instructions, branch optimization, and precision-performance trade-off optimization. Experiments on simulators demonstrate that the optimized vector exponential and logarithmic functions meet industry-standard high precision and outperform the current best open-source implementations, achieving a speedup ratio of over 1.44. Real-world application tests further show that applications can achieve efficient vectorization with the support of the optimized vector functions, resulting in an average performance improvement of 2.53 times compared to the original scalar implementations.


相关文章

[1]傅游, 韩昊, 孙月娇, 梁建国, 叶雨曦, 花嵘. 基于OpenMP的硅晶体分子动力学模拟的空间分解着色及向量化研究#br#[J]. 计算机工程与科学, 2024, 46(09): 1566-1575.
[2]范小康, 夏泽宇, 龙思凡, 杨灿群. 基于ARM SVE的光滑粒子流体动力学SIMD加速方法[J]. 计算机工程与科学, 2021, 43(06): 989-996.
[3]荀长庆, 陈照云, 文梅, 孙海燕, 马奕民. 以编译为导向的Matrix-DSP程序分析与优化[J]. 计算机工程与科学, 2020, 42(10高性能专刊): 1791-1800.
[4]郭娜,路梅,赵向军. 习题的关联分析及其向量化表示方法[J]. 计算机工程与科学, 2017, 39(10): 1950-1957.
[5]李春江,黄娟娟,徐颖,董钰山. 基于数据对齐属性指导的GCC自动向量化优化[J]. J4, 2014, 36(06): 1011-1017.
[6]张民选. YH—2算法a^x,logax,x^y函数的算法设计[J]. J4, 1997, 19(3): 55-58.
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社