跳到主要内容

fileparser

fileparser 库用于从各类文件中解析、提取结构化内容(如文档中的嵌入对象、元数据、内嵌文件等),常用于文件取证与样本分析。

典型使用场景:

  • 解析文件:fileparser.ParseFile(filePath) 解析给定文件,返回按类型分组的提取结果(map[string][]File)。

与相邻库的关系:fileparser 是文件内容提取工具,与 pandoc(文档转换)、mimetype(类型识别)、file(文件读写)配合,用于"从文件里挖出有用内容"的取证与分析场景。

共 1 个函数

函数索引

函数参数返回值说明
fileparser.ParseFilefilePath stringmap[string][]types.File, error解析办公文档(Word/Excel/PPT 等)并按元素类型提取其中的内容元素

函数详情

ParseFile

ParseFile(filePath string) (map[string][]types.File, error)

解析办公文档(Word/Excel/PPT 等)并按元素类型提取其中的内容元素

参数

参数名类型说明
filePathstring待解析的文档文件路径

返回值

序号类型说明
r1map[string][]types.File按元素类型分组的提取结果(如文本、图片等)
r2error错误信息

示例

// 解析一个 docx 文档,按类型获取其中的元素
elements, err = fileparser.ParseFile("/tmp/demo.docx")

if err == nil {
for typ, items in elements { println(typ, len(items)) }
}