wie du es auch anstellst: HTML sagt dem Browser nur, was du auf dem Bildschirm haben willst, wenn das irgendwie layouted werden soll brauchst du CSS
Also wirst du wohl CSS brauchen, um die Textausgabe über dein Bildchen zu legen.
ZB ein DIV mit dem Männchen als Hintergrundbild (background-image) und so gewählten Innenabständen (margin-left, -top, -right, -bottom) dass nur der Sprechblasenbereich genutzt wird.
nützliche Links:
css4you
und
SelfHTML-CSS