Obtener el contenido especificado en el búfer en c

estoy descargando un archivo jsp desde el servidor http en c. Pero estoy obteniendo el contenido del archivo como se muestra

  Hello, user   

en un búfer. Ahora quiero capturar “Hola, usuario” solo en mi búfer. ¿Alguien puede ayudarme a encontrar el código en C.

Utilice libexpat. Este es un analizador xml orientado a la transmisión escrito en C. Puede registrar un controlador para la etiqueta BODY y leer el contenido

Echa un vistazo a esta pregunta Obtención de datos xml utilizando xml parser expat

Puede intentar eliminar el HTML, pero esto podría no funcionar correctamente si hay más contenido fuera de las tags (requeriría un filtrado más específico, por ejemplo, verificando el nombre de la etiqueta circundante).

Sin probar pero debería funcionar:

 char *html = ...; // html being a pointer to the document's contents int ip = 0; // the input position int op = 0; // the ouput position int in_tag = 0; // are we inside a html tag? char c; // current character while(c = html[ip++]) { if(c == '<') in_tag = 1; else if(c == '>') in_tag = 0; else if(c == '\n' || c == '\r') // strip line breaks ; else if(!in_tag) html[op++] = c; } html[op] = '\0'; 

Básicamente, desea escanear el búfer e ignorar todo lo que está entre < y > :

 char *get_text (char *dst, char *src) { int html = 0; char ch; while (ch = *src++) { if (ch == '<' || ch == '>') { html = (ch == '<'); } else if (!html) { *dst++ = ch; } } *dst = '\0'; return dst; }