V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
KeepChallenging
V2EX  ›  Java

Apache Tika 如何创建新的 Detector

  •  
  •   KeepChallenging · 2022-08-14 21:11:50 +08:00 · 867 次点击
    这是一个创建于 838 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我创建了一个 Detector ,请问如何将这个 Detector 添加到 Tika ?

    package com.freedom.tika;
    
    import org.apache.commons.io.IOUtils;
    import org.apache.tika.detect.Detector;
    import org.apache.tika.metadata.Metadata;
    import org.apache.tika.mime.MediaType;
    
    import java.io.IOException;
    import java.io.InputStream;
    import java.nio.charset.StandardCharsets;
    
    /**
     * 自定义检测类型,目前主要为 svg
     */
    public class SvgDetector implements Detector {
    
        @Override
        public MediaType detect(InputStream input, Metadata metadata) throws IOException {
            String text = IOUtils.toString(input, StandardCharsets.UTF_8);
            if (text.startsWith("<svg") && text.endsWith("</svg>")) {
                return MediaType.parse("image/svg+xml");
            }
    
            return null;
    
        }
    }
    
    
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2637 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 10:30 · PVG 18:30 · LAX 02:30 · JFK 05:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.