Skip to content

希望能增加更多mineru启动指令配置 #222

@ElsaReedz

Description

@ElsaReedz

Feature Description / 功能描述

目前在FileOrURLToMarkdownConverterBatch算子部分,只支持配置mineru_backend。希望增加mineru官方的一些配置指令,比如指定多卡的数据并行和张量并行等,以及允许配置client模式以连接外部mineru实例。另外,目前在批处理过程中,每次对文档解析完成后就会重复卸载和加载mineru模型,这点也希望可以优化一下

System Info (dataflow env) / 系统信息(dataflow env

open-dataflow codebase version: 1.0.5
Ubuntu 22.04
python 3.12.11

Additional Information / 其他补充

No response

Metadata

Metadata

Assignees

No one assigned

    Labels

    enhancementNew feature or request

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions