LlamaIndex API Reference

AmazonKnowledgeBaseRetriever

AmazonKnowledgeBaseRetriever-1

AnthropicAgentWorker

AnthropicSession

AstraDBVectorStore

AudioSubtitlesReader

AudioTranscriptParagraphsReader

AudioTranscriptReader

AudioTranscriptSentencesReader

AzureAISearchVectorStore

AzureCosmosDBMongoDBVectorStore

AzureCosmosDBNoSqlVectorStore

AzureCosmosNoSqlChatStore

AzureCosmosNoSqlDocumentStore

AzureCosmosNoSqlIndexStore

AzureCosmosNoSqlKVStore

AzureCosmosVCoreChatStore

AzureCosmosVCoreDocumentStore

AzureCosmosVCoreIndexStore

AzureCosmosVCoreKVStore

AzureDynamicSessionTool

AzureOpenAIEmbedding

AzureOpenAIResponses

AzureQueryResultSearchBase

AzureQueryResultSearchDefault

AzureQueryResultSearchHybrid

AzureQueryResultSearchSemanticHybrid

AzureQueryResultSearchSparse

BaseDocumentStore

BaseInMemoryKVStore

BaseMemoryBlock

BaseObjectNodeMapping

BasePromptTemplate

BaseQueryEngine

BaseSynthesizer

BaseVectorStore

CallbackManager

ChatMemoryBuffer

ChatMessageAdapter

ChatSummaryMemoryBuffer

ChromaVectorStore

CompactAndRefine

CondenseQuestionChatEngine

ContextChatEngine

CorrectnessEvaluator

DeepInfraEmbedding

DefaultContextGenerator

DuplicatesStrategy

ElasticSearchVectorStore

FactExtractionMemoryBlock

FaithfulnessEvaluator

FirestoreVectorStore

FireworksEmbedding

GeminiEmbedding

GeminiLiveSession

HuggingFaceEmbedding

HuggingFaceInferenceAPI

HuggingFaceInferenceAPIEmbedding

IngestionPipeline

JinaAIEmbedding

JSONReaderError

JSONStringifyError

KeywordExtractor

KeywordTableIndex

KeywordTableLLMRetriever

KeywordTableRAKERetriever

KeywordTableSimpleRetriever

KVDocumentStore

LLamaCloudFileService

LlamaCloudIndex

LlamaCloudRetriever

LLMMultiSelector

LLMQuestionGenerator

LLMSingleSelector

MarkdownNodeParser

MetadataAwareTextSplitter

MetadataReplacementPostProcessor

MilvusVectorStore

MistralAIEmbedding

MistralAISession

MixedbreadAIEmbeddings

MixedbreadAIReranker

MongoDBAtlasVectorSearch

MongoDocumentStore

MultiModalEmbedding

NotSupportCurrentRuntimeClass

ObjectRetriever

OllamaAgentWorker

OllamaEmbedding

OpenAIAgentWorker

OpenAIEmbedding

OpenAIResponses

OpenAPIActionTool

PineconeVectorStore

PostgresDocumentStore

PostgresIndexStore

PostgresKVStore

QdrantVectorStore

QueryEngineTool

QuestionsAnsweredExtractor

ReACTAgentWorker

RelevancyEvaluator

ReplicateSession

RetrieverQueryEngine

RollbackableTransformComponent

RouterQueryEngine

SentenceSplitter

SentenceWindowNodeParser

SimilarityPostprocessor

SimpleChatEngine

SimpleChatStore

SimpleCosmosDBReader

SimpleDirectoryReader

SimpleDocumentStore

SimpleIndexStore

SimpleMongoReader

SimplePostgresReader

SimpleToolNodeMapping

SimpleVectorStore

StaticMemoryBlock

SubQuestionOutputParser

SubQuestionQueryEngine

SummaryExtractor

SummaryIndexLLMRetriever

SummaryIndexRetriever

SupabaseVectorStore

TogetherEmbedding

TokenTextSplitter

TransformComponent

UpsertsAndDeleteStrategy

UpsertsStrategy

UpstashVectorStore

VectorIndexRetriever

VectorMemoryBlock

VectorStoreIndex

VercelMessageAdapter

VoyageAIEmbedding

WeaviateVectorStore

Classes

HTMLReader

Defined in: packages/readers/src/html.ts:11

Extract the significant text from an arbitrary HTML document. The contents of any head, script, style, and xml tags are removed completely. The URLs for a[href] tags are extracted, along with the inner text of the tag. All other tags are removed, and the inner text is kept intact. Html entities (e.g., &) are not decoded.

Extends

FileReader<Document>

Constructors

Constructor

new HTMLReader(): HTMLReader

Returns

HTMLReader

Inherited from

FileReader<Document>.constructor

Methods

loadDataAsContent()

loadDataAsContent(fileContent): Promise<Document<Metadata>[]>

Defined in: packages/readers/src/html.ts:18

Public method for this reader. Required by BaseReader interface.

Parameters

fileContent

Uint8Array

The content of the file.

Returns

Promise<Document<Metadata>[]>

Promise<Document[]> A Promise object, eventually yielding zero or one Document parsed from the HTML content of the specified file.

Overrides

FileReader.loadDataAsContent

parseContent()

parseContent(html, options): Promise<string>

Defined in: packages/readers/src/html.ts:33

Wrapper for string-strip-html usage.

Parameters

html

string

Raw HTML content to be parsed.

options

Partial<Opts> = {}

An object of options for the underlying library

Returns

Promise<string>

The HTML content, stripped of unwanted tags and attributes

See

getOptions

getOptions()

getOptions(): Partial<Opts>

Defined in: packages/readers/src/html.ts:46

Wrapper for our configuration options passed to string-strip-html library

Returns

Partial<Opts>

An object of options for the underlying library

See

https://codsen.com/os/string-strip-html/examples

HTMLNodeParser

Previous Page

HuggingFaceEmbedding

Next Page

On this page

Extends Constructors Constructor Returns Inherited from Methods loadDataAsContent()Parameters fileContent Returns Overrides parseContent()Parameters html options Returns See getOptions()Returns See