华为新专利:AI模型量化技术,内存占用大减!

   时间:2025-02-07 12:02 来源:ITBEAR作者:杨凌霄

近日,华为技术有限公司在人工智能领域的一项新专利引起了广泛关注。据天眼查App透露,华为已正式公布了名为“人工智能模型的量化方法、处理系统和量化单元”的专利。

该专利的核心在于一种创新的量化方法,该方法通过量化单元来优化AI模型的内存占用。具体而言,量化单元会根据运行AI模型的计算设备中各个计算单元的处理粒度,灵活地将量化矩阵分割成多个适合不同计算单元处理的小块,即分块量化矩阵。这一步骤确保了每个计算单元都能高效处理其负责的部分。

进一步地,量化单元会对这些分块量化矩阵进行量化处理,并将处理后的结果存储在存储器中。这一创新不仅减少了AI模型对内存资源的占用,还提升了整体的处理效率。值得注意的是,这里的量化矩阵可以涵盖权重矩阵和激活矩阵,进一步拓宽了该方法的应用范围。

尤为重要的是,华为的这一专利在量化过程中摒弃了传统的基于张量级别进行离群值统计的方法。相反,它完全基于计算设备的各个计算单元的处理粒度进行量化,从而实现了对权重矩阵和激活矩阵的实时量化。这一转变不仅简化了量化流程,还提高了量化的准确性和效率。

业内人士指出,华为此次公布的专利无疑为人工智能模型的优化提供了新的思路。通过创新的量化方法,华为不仅解决了AI模型内存占用大的问题,还为AI模型的实时处理和高效运行奠定了坚实的基础。这一专利的公布,无疑将推动人工智能技术在更多领域的应用和发展。

 
 
更多>同类内容
全站最新
热门内容