Apache Solr 删除文档


要从 Apache Solr 的索引中删除文档,我们需要在 标记之间指定要删除的文档的 ID。

<delete>   
    <id>003</id>
    <id>005</id>
    <id>004</id>
    <id>002</id>
</delete> 

在这里,此 XML 代码用于删除具有 ID 的文档 003 and 005 .将此代码保存在名称为的文件中 删除.xml .

如果要从属于名为的核心的索引中删除文档 my_core , 然后你可以发布 删除.xml 文件使用 post 工具,如下图。

[Hadoop@localhost bin]$ ./post -c my_core delete.xml 

执行上述命令后,你将获得以下输出。

/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core
6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files 
org.apache.Solr.util.SimplePostTool delete.xml 
SimplePostTool version 5.0.0 
Posting files to [base] url http:// localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are 
xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,
rtf,htm,html,txt,log 
POSTing file delete.xml (application/xml) to [base] 
1 files indexed. 
COMMITting Solr index changes to http:// localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.179 

确认

访问 Apache Solr Web 界面的主页并选择核心为 my_core .尝试通过在文本区域中传递查询“:”来检索所有文档 q 并执行查询。在执行时,你可以观察到指定的文档被删除。

Delete Document

删除字段


有时我们需要根据 ID 以外的字段删除文档。例如,我们可能必须删除城市为 Chennai 的文档。

在这种情况下,你需要在 标记对中指定字段的名称和值。

<delete> 
    <query>city:Chennai</query>
</delete>

另存为 删除字段.xml 并对名为的核心执行删除操作 my_core 使用 post Solr 的工具。

[Hadoop@localhost bin]$ ./post -c my_core delete_field.xml 

在执行上述命令时,它会产生以下输出。

/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core
6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files 
org.apache.Solr.util.SimplePostTool delete_field.xml 
SimplePostTool version 5.0.0 
Posting files to [base] url http:// localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are 
xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,
rtf,htm,html,txt,log 
POSTing file delete_field.xml (application/xml) to [base] 
1 files indexed. 
COMMITting Solr index changes to http:// localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.084 

确认

访问 Apache Solr Web 界面的主页并选择核心为 my_core .尝试通过在文本区域中传递查询“:”来检索所有文档 q 并执行查询。在执行时,你可以观察到包含指定字段值对的文档被删除。

Value Pair

删除所有文件


就像删除特定字段一样,如果要从索引中删除所有文档,只需在标签 之间传递符号“:”,如下所示。

<delete> 
    <query>*:*</query>
</delete>

另存为 删除所有.xml 并对名为的核心执行删除操作 my_core 使用 post Solr 的工具。

[Hadoop@localhost bin]$ ./post -c my_core delete_all.xml

在执行上述命令时,它会产生以下输出。

/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core
6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files 
org.apache.Solr.util.SimplePostTool deleteAll.xml 
SimplePostTool version 5.0.0 
Posting files to [base] url http:// localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are 
xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,
htm,html,txt,log 
POSTing file deleteAll.xml (application/xml) to [base] 
1 files indexed. 
COMMITting Solr index changes to http:// localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.138

确认

访问 Apache Solr Web 界面的主页,选择核心为 my_core .尝试通过在文本区域中传递查询“:”来检索所有文档 q 并执行查询。在执行时,你可以观察到包含指定字段值对的文档被删除。

Deleted Value Pair

使用 Java(客户端 API)删除所有文档

以下是将文档添加到 Apache Solr 索引的 Java 程序。将此代码保存在名称为的文件中 更新文档.java .

import java.io.IOException;  

import org.apache.Solr.client.Solrj.SolrClient; 
import org.apache.Solr.client.Solrj.SolrServerException; 
import org.apache.Solr.client.Solrj.impl.HttpSolrClient; 
import org.apache.Solr.common.Solr输入Document;  

public class DeletingAllDocuments { 
    public static void main(String args[]) throws SolrServerException, IOException {
        // 准备 Solr 客户端
        String urlString = "http:// 本地主机:8983/Solr/my_core";
        SolrClient Solr = new HttpSolrClient.Builder(urlString).build();
      
        // 准备 Solr 文档
        Solr输入Document doc = new Solr输入Document();
          
        // 从 Solr 中删除文档
        Solr.deleteByQuery("*");
         
        // 保存文档
        Solr.commit();
        System.out.println("Documents deleted");
    }
}

通过在终端中执行以下命令来编译上述代码:

[Hadoop@localhost bin]$ javac DeletingAllDocuments 
[Hadoop@localhost bin]$ java DeletingAllDocuments

执行上述命令后,你将获得以下输出。

Documents deleted